Epik中國區負責人EricYao:風口一直在變,人類合作的需求是永恆

知識圖譜發源於人工智慧重要分支知識工程,知識圖譜的發展歷程最早可追溯到20世紀50年代,人工智慧誕生並初步發展。20世紀70年代~90年代,人工智慧領域專家認識到知識對於人工智慧發展的重要性,知識工程誕生並迅速發展。在1990~2000年間,全球資訊網Web1。0的產生為大眾提供了開放平臺,為網際網路環境下大規模知識表示和共享奠定了基礎。在2000-2012年間。全球資訊網使得知識從封閉走向開放,從集中式變為分散式,群體智慧由此出現,典型代表為維基百科,群體智慧也成為以後大規模結構化知識圖譜的重要前提。2012年,谷歌推出知識圖譜專案產品,標誌著知識圖譜正式誕生,知識工程進入發展新時期。

隨著科技發展進步,高效化、智慧化已經成為社會發展的重要趨勢。而知識圖譜作為人工智慧重要分支知識工程的具體應用體現,不僅能加深垂直應用領域的智慧化程度,還能為使用者降低運營成本、提高系統運作效率,切合社會高效化、智慧化的發展需求。社會高效化,智慧化的發展趨勢促使社會對知識圖譜技術的需求逐步提高,知識圖譜行業發展空間將逐步擴大。

「話事人 on Chain」第4期特別邀請到了Epik Protocol中國區負責人Eric Yao,分享知識圖譜+區塊鏈的商業邏輯和價值。

以下為對話實錄,經鏈得得編輯整理。

Eric:

很多人都看過駭客帝國的故事,看駭客帝國的時候,有兩個疑問,就是圈養人類的超級AI - 母體,它的錢和智力是從哪兒來的?如果錢是銀行裡的,早被人類政府凍結了,根本發展不起來,猥瑣發育都不行。所以錢應該是加密貨幣;如果智力是Google / Baidu 提供的中心化知識圖譜,那拔網線就把母體制得服服帖帖了。所以知識圖譜庫應該也是去中心化的。如果人工智慧不是個偽命題,那去中心化的知識圖譜基礎設施應該是必然的趨勢了,或早或晚而已。

EpiK的全稱是epigraphy knowledge,代表著銘刻在石頭上的知識,是致力於藉助區塊鏈技術,打造的一個去中心化的,共建共享共益的安全可信知識圖譜協作平臺。

主持人:很多投資者對“知識圖譜”這個概念並不熟悉。請介紹一下Epik正在構建的“知識圖譜”的概念和價值。

Eric:

人工智慧發展被分為四大階段:計算智慧、感知智慧、認知智慧和意識智慧 。計算智慧讓機器能存會算;感知智慧讓機器能聽會說、能看會認;認知智慧解決機器能理解會思考的問題;意識智慧讓機器自學習和記憶。讓機器具備認知智慧,即讓機器具備理解和解釋能力,機器的智慧離不開大規模和結構化的背景知識,

目前知識圖譜是這種結構化背景知識的解決方案,機器認知智慧的實現依賴於知識圖譜技術。他是一種用圖模型來描述知識和建模世界萬物之間關聯關係的大規模語義網路,是大資料時代知識表示的重要方式之一。知識圖譜可以被理解為人腦神經元系統的一個仿生系統,神經元的連線就像知識圖譜中節點的連線一樣。

由於知識圖譜富含實體、概念、屬性和關係等資訊,使機器理解與解釋現實世界成為可能,因此知識圖譜成為了人工智慧理解和推演人類知識的基石。

主持人:長期來看,Epik的目標是什麼?

Eric:

銘識協議致力於透過去中心化的方式構建人類知識庫,藉助區塊鏈技術打造共建共享共益的知識圖譜協作平臺,依賴於去中心化儲存技術(Filecoin )提供的可信儲存能力、通證經濟模型(Token Economy )提供的 可信激勵能力、去中心化自治組織(DAO )提供的可信治理能力和去中心化金融技術(DeFi )提供的可信金融能力,組織並激勵全球社群成員將人類各領域知識梳理成知識圖譜,共建共享並持續更新這一人類永恆知識庫,從而將人工智慧 ( AI ) 的視野拓展到更智慧的未來。

主持人:“利用去中心化的方式構建知識庫”,這種方式和維基百科的區別是什麼?

Eric:

現存大量知識的載體都是給人看的,比如書、影片、圖片,包括wiki百科。但在人類進入認知智慧的當下,我們需要將這些人類能看懂的知識傳授給AI,這就需要一種AI能理解的知識表示方式,而目前最可行的解決方案就是知識圖譜。所以EpiK構建的知識圖譜庫是給AI看的,是人類向Ai的一次傳業受道解惑。

主持人:構建知識圖譜的過程非常繁瑣且複雜。按照Epik的規劃,知識圖譜的資料探勘、採集、結構化均由領域專家和賞金獵人完成。如何保證他們的工作是有效、可靠的?

Eric:

EPIK依據通證經濟和去中心化組織DAO的理論和模型,提供了可信激勵和可信治理的模型。來共同確保各個參與方在追求個人利益最大化的情況下,有序協作完成將人類知識庫轉變為知識圖譜的宏大工程。

領域專家是知識圖譜資料的組織者和驗收員,也是整個系統中唯一有權利上傳知識圖譜資料的群體,他們透過貢獻高品質的知識圖譜資料獲得收益。當然,作為全系統唯一有資料上傳權利的群體,對於領域專家有著嚴格的監督機制。首先,領域專家必須由已經是領域專家的人提名產生,提名後的領域專家還需要在社群中獲得社群投票的支援,每一票都意味著一個EPK被鎖定。一旦領域專家票數(鎖倉EPK數)少於最小閾值,則失去資格。如果領域專家上傳的虛假、垃圾的資料,社群講給予除名處罰,提名了被除名領域專家的人也將受到連帶懲罰。

知識圖譜資料生成任務是繁重的,領域專家難以獨立完成,所以系統內還設計了賞金獵人角色,他們是知識圖譜資料的採集員和標註員,他們透過完成領域專家釋出的各種任務來獲得收益。在接下來發布的治理白皮書中會闡述更多的細節。

主持人:構建知識圖譜需要大量的資料作為支撐。除了開放連結知識庫之外,難免需要非開放的資料,包括感測器、定位系統等物聯網感知裝置提供的資料。作為一個去中心化的專案,如何獲取或積累這些資料?

Eric:

EpiK的資料是由領域專家上傳的,領域專家是一個很靈活的角色,他的權力可以被賦予人,也可以被賦予機器,他將充當中心化知識和去中心化知識的橋樑。他可以是大學教授,可以使貼吧吧主,可以是業務專家,可以是NLP機器人,可以是物聯網裝置,可以是任何形式的人類知識佈道者。

主持人:網際網路行業已經發展出較為成熟的知識圖譜產業鏈,其中既有騰訊“星圖”、百度“知心”、阿里商品圖譜這樣的綜合型知識圖譜,也有明略、達觀、竹間這樣的垂直領域知識圖譜提供商。Epik如何與這些成熟的知識圖譜提供商競爭?如何保證領域專家和賞金獵人制作的知識圖譜對於使用者有更高的水平和價值?

Eric:

首先,底層的技術生態的開放是一個趨勢,20年前,封閉的Windows吊打開放的Linux;10年前,封閉的IOS吊打開放的Android。現在的局面想必大家都很清晰了,封閉生態是很難戰勝開放生態的成長速度的。這就是網際網路巨頭和EpiK的區別。

將人類以各種形式傳承的知識轉變為一個超大規模的高質量知識圖譜並非易事,面臨諸多挑戰。首先,人類知識涉及的專業領域之廣之深,遠非一個組織、一家公司甚至一個國家能完全獨立掌握。其次,在知識圖譜構建過程中,包括採集、提取、消歧和融合等多個需要人工參與的環節,這意味著每個專業領域的知識圖譜構建都成本不低。最後,也是最為棘手的問題是,由於知識圖譜構建成本高,大多數人無法獨自構建,這就意味著很多AI需要使用第三方提供的知識圖譜來構建認知能力, 如果這些被依賴的第三方知識圖譜資料被惡意篡改了,將直接導致眾多 AI 的認知紊亂,進而失控。

因此一個不受中心化控制、能激勵各方力量參與共建、資料安全可信防篡改的知識圖譜資料庫顯得必不可少。

同時EPIK透過共建共享生成知識庫的方式,不但收集資料的成本更低,同時一次生成,多次共享。對外提供資料服務資料使用成本也更低。

主持人:在應用方面,Epik主要面向哪些領域構建知識圖譜?終端使用者的應用場景有哪些?

Eric:

我們團隊的聚焦點在於構建去中心化的協作閉環,讓各個領域的知識圖譜都能在這樣的協作網路中滾雪球滾起來。當然,我們需要showcase,目前我們的領域專家分佈在語音、醫療、保險、法律、金融、電子遊戲、鄉村產業結構這幾個方向,相關的題庫會陸續在我們的知識大陸產品中跟大家見面。

使用者的最終應用場景,會是私人醫生幫助你智慧分析病歷,私人保險助理幫助你智慧配置醫療保險,智慧金融助理幫助你解答各種金融問題等等。

主持人:聽說EpiK在近期要上線一款叫做知識大陸的遊戲化知識圖譜資料採集產品,能為我們提前劇透一下嗎?知識大陸是一款怎樣的產品?他背後的運作機制是什麼?如何透過知識大陸來構建知識圖譜的呢?

Eric:

知識大陸是EpiK以遊戲化方式落地知識圖譜協作的重要生態工具產品,將枯燥繁雜的知識圖譜構建工作轉化為玩遊戲的方式,不需要有多專業、多高階的知識儲備,打破圈層限制,使用者只需要按照遊戲規則及提示完成任務,即可獲得獎勵,讓更多的人參與進來。知識大陸未來將開啟涉及各行業生態的知識協作專案,舉例來說,當前,知識大陸推出的首個協作專案是開源語音庫,具體工作流程是:領域專家梳理出語音類知識圖譜結構,他們將這些知識資料細分成若干文字、圖片轉化語音等任務,並將這些任務分發給使用者,使用者只需用上下班乘車或平時零散時間就可以參與任務,會得到Token的獎勵。

知識大陸可以說是EPIK生態中的普通使用者的一個重要入口,每個人都可以下載知識大陸,透過遊戲化的方式來在知識大陸中回答問題,標註資料來獲取收益。在獲得收益的過程中對知識上鍊這件事情會有原來越深刻的理解,實際感知到對知識庫傳承所做的貢獻。同時知識大陸也是對接各個商業化資料場景,用來發布資料需求任務的重要平臺。

主持人:Eipk代幣總髮行量是多少?如何進行分配?

Eric:

EpiK Protocol 原生代幣為 EPK,總量10億,其中創始團隊5% 基金會5% 投資人20% 挖礦70%,在主網上線後連續50年內全部釋放完畢,永不增發。

主持人:Eipk代幣價值如何體現?其經濟模型是什麼樣的?如何實現社群治理?

Eric:

在大方向上來看Epik的代幣價值取決於他所處的資料儲存領域和經濟模型,鏈上高價值的資料自身就帶有非常強的商業化價值,你要使用已經整理好的知識圖譜就需要一定量的EPK做抵押。

下面簡單說一下epik的經濟模型

首先參與epik生態的各個參與方都是需要一定的epk抵押來做資料和資質擔保的,每臺礦機需要抵押最少1K個EPK,每位領域專家都需要有10W epk的抵押投票才能當選,使用Epik上的資料也是需要按資料多少抵押一定的EPK。

在DAO生態當中的5個角色分配主網上線後每天產生的EPK。

礦工擁有其中75%的EPK,領域專家擁有其中9%的EPK,投票使用者分享其中1%的EPK。另外15%的EPK將會根據網路每日訪問流量浮動,而這15%的部分是礦工和領域專家相互博弈的關係。

網路活躍度的評判標準就在於全網為了獲取每日訪問流量而抵押進來的EPK佔總流通量比重(1EPK=10Mb/天),比例越高則說明資料需求量增大,這就要求礦工提升頻寬質量。如果資料需求量降低,這就要求領域專家提供更高質量的資料。

這就好比圖書館裡訪客多了,就需要更多的座椅,即花錢讓礦工提升頻寬。訪客少的時候,需要更多錢購買更優質的書籍吸引訪客,即給賞金獵人和領域專家去生成更多優質知識圖譜資料。

不同於Filecoin生態中官方和大礦工的博弈,資料的生產方和資料的儲存方的博弈是生態中最重要的博弈關係。

在社群治理方面我們會進行社群分層治理,系統層人人持幣投票參與治理,儲存層礦工按算力投票參與治理,知識層領域專家一人一票參與治理,不同的引數僅有利益相關方參與治理,避免治理泛化,效率低下。

主持人:Eipk與Fliecoin及其代幣的關係是什麼?

Eric:

EPIK的定位是Filecoin的二層網路,EpiK Protocol 鏈上資料是各個不同領域的增刪查改日誌資料,使用的時候,使用者可以指定要哪些領域的資料,把這些日誌資料下載到本地後Replay成本地資料庫並對外提供API資料介面。

這樣的過程我們能解耦各領域專家的工作,也能保證資料可更新但不可被篡改。

但是隨著EpiK Protocol網路執行時間的增長,各領域日誌檔案增加,在本地Replay這些日誌檔案會變得耗時。

此時我們最好地選擇是,定期將各領域資料的快照傳到Filecoin上,當要使用某個領域資料時,只需要從Filecoin上下載最新的快照資料,然後從EpiK Protocol網路中下載最新的更新日誌就可快速在本地恢復資料庫進行使用。

Filecoin適合大檔案的冷儲存,EpiK適合小檔案的熱儲存,相互配合,充分利用市場上的閒置硬體資源,更好地服務於知識圖譜協作網路,也更好地服務去中心化儲存生態。

主持人:Epik包含的可信金融服務是如何實現的?與知識圖譜的關係是什麼?

Eric:銘識協議的可信金融能力來自於去中心化金融技術 DeFi。數字貨幣發展至今,頭部效應明顯,大部分使用者都持有著諸如 BTC/ETH 這類的主流幣種。為了幫助這些使用者也能順滑地參與到去中心化知識圖譜生態的協作中來,我們在銘識協議之上為其提供了去中心化借貸服務,比如一個使用者持有主流幣BTC資產,這首他需要使用epk來訪問知識庫資料或者發起投票,他可以透過銘識協議的跨鏈閘道器將 BTC兌換成 eBTC,然後透過銘識協議的借貸服務超額抵押 eBTC 借出 EPK ,然後抵押 EPK 成為礦工挖礦 EPK,或者票選自己成為領域專家獲得持續性 EPK 獎勵,或者抵押 EPK 下載所需的知識圖譜資料。等有一天想退出知識圖譜協作網路時,將抵押的 EPK 取出,在銘識協議借貸服務裡歸還 EPK 取回之前超額抵押的 eBTC, 然後透過跨鏈閘道器跨出拿回原生BTC。

主持人:在過去的幾年當中,區塊鏈行業的風口不斷變換。DeFi、DEX、NFT等都是行業發展的熱點。epik要如何不斷適應這些新的風口和熱點?換句話說,如何避免Epik成為一個朝生暮死的空氣專案?

Eric:

EpiK的底層基礎設施是一個去中心化資料湖方案,每個領域專家被推選上來後,實際上就擁有了一個人人可讀的小型開放資料庫。熱點和風口一直在變,但是人類合作維護資料的需求是永恆的。我們可以一起維護某個領域的知識圖譜,也可以一起維護某個風格的NFT畫作,也可以一起維護共同的回憶,也可以透過這種方式來遺傳自己的資料。我們聚焦於知識圖譜,但想象空間留給了社群。