基於圖神經網路的知識圖譜研究進展

知識圖譜本身是一種圖結構資料,採用圖構建知識和資料之間的關聯,應用圖神經網路技術,有望結合知識和資料,實現更好的可解釋和可信人工智慧技術。本文將介紹基於圖神經網路的知識圖譜學習與計算以及基於圖神經網路融合知識圖譜資訊的應用的研究進展。

1 知識圖譜與圖神經網路

近幾年來,人工智慧技術得到了飛速發展,其進展突出體現在以知識圖譜(Knowledge Graph)為代表的知識工程和以圖神經網路(Graph Neural NetWorks, GNN)為代表的深度學習等相關領域。融合知識圖譜與圖神經網路已然成為研究人員進一步完善知識圖譜學習與提升圖神經網路模型推理能力的重要技術思路。

知識圖譜是以圖的形式表現客觀世界中的實體及其之間關係的知識庫,實體可以是真實世界中的物體或抽象的概念,關係則表示了實體間的聯絡。因此,知識圖譜能夠以結構化的形式表示人類知識,透過知識表示和推理技術,可以給人工智慧系統提供可處理的先驗知識,讓其具有與人類一樣的解決複雜任務的能力[1~3]。如何更好地構建、表示、補全、應用知識圖譜,已經成為認知和人工智慧領域重要的研究方向之一。

圖神經網路的概念最早於2005年由戈裡(Gori)等人[4]提出,是一種專門用於處理圖結構資料的神經網路模型。使用圖可以更準確和靈活地對現實應用中的資料建模,如在電子商務領域中的使用者–產品互動圖、化學領域的分子圖、醫藥領域的藥物副作用圖等。因此,研究者們設計了多種圖神經網路模型,包括圖卷積網路(Graph Convolutional Network,GCN)[5~7]、圖注意力網路(Graph Attention Network,GAT)[8]等。此外,由於異質圖具有更靈活的建模和融合資訊的能力[9],研究者們還嘗試設計和應用基於異質圖的圖神經網路模型[10~12]。如何設計更合理的圖神經網路模型,使資訊沿著圖結構更合理地傳播,從而提升模型對圖結構資料的擬合能力,是人工智慧領域的一個熱點問題。

近年來,描述常識和事實的知識圖譜成為了學術界和工業界廣泛使用的知識表示方式,圖神經網路在資訊傳播、關係歸納偏置上也展現了優秀的效能[13]。考慮到知識圖譜本身恰好就是一種圖結構資料,因此採用圖構建知識和資料之間的關聯,同時應用圖神經網路技術,有望結合知識和資料實現更好的可解釋和可信人工智慧技術。一方面,利用圖神經網路在學習節點、邊表示上的優勢,可以更好地學習知識圖譜的實體、關係的嵌入表示,改善關係抽取等任務,幫助構建知識圖譜,以及提高連結預測等任務,幫助補全知識圖譜;另一方面,利用圖神經網路在資訊傳播和推理上的優勢,可以更有效地在應用任務中引入知識圖譜中的資訊,從而改善如文字挖掘、推薦系統、計算機視覺等領域中的應用效果,提供可解釋的模型。

本文將對知識圖譜與圖神經網路模型相融合的方法及應用進行綜述。

2 基於圖神經網路的知識圖譜學習與計算

由於知識圖譜可以表徵實體之間結構化的關係,如今已經成為認知和人工智慧領域重要的研究方向。圖神經網路利用深度神經網路對圖資料中的拓撲結構資訊和屬性特徵資訊進行整合,進而提供更精細的節點或子結構的特徵表示,並能很方便地以解耦或端到端的方式與下游任務結合,巧妙地滿足了知識圖譜對學習實體、關係的屬性特徵和結構特徵的要求。本節主要從知識圖譜中的5個典型任務介紹基於圖神經網路的知識圖譜學習方法。

知識圖譜表示學習

知識圖譜表示學習,即為知識圖譜中的實體和關係學習出一個低維度的向量表示,同時包含一些語義資訊,從而得以在下游任務中更加方便地提取和利用知識圖譜中的資訊,例如連結預測[10]、常識問答[1]等。透過應用圖神經網路,在學習知識圖譜的表示時,每個實體都將利用到與其相關的其他實體中的資訊,打破了彼此之間的孤立性,從而學得更完整更豐富的實體、關係表示。

經典的翻譯系列模型在知識表示和推理的問題上顯示出強大的學習能力,例如圖1(a)中,TransE(Translating Embedding)[14]提出頭實體的向量表示加上關係的向量表示,應當等於尾實體的向量表示,透過這種約束,TransE學得了實體之間豐富的語義關係。Cai等人[15]將翻譯系列模型的思想引入到了GCN[7]中,提出了TransGCN(如圖1(b)所示),綜合了TransE模型和圖神經網路的優點。考慮到知識圖譜中的關係具有不同種類的特點,關係圖卷積網路(R-GCN)[10] 使用關係特定的變換矩陣擴充套件了GCN,如圖1(c) 所示,並且為了緩解由於關係種類過於豐富而導致的引數量巨大的問題,提出了基分解和塊對角分解兩種正則化策略。當出現知識庫之外的實體時,一種思路是利用相關的實體和關係學習新實體的表示,例如濱口(Hamaguchi)等人[16]提出使用圖神經網路利用鄰實體和對應的關係獲得新實體的表示,並針對知識圖譜的特點,為圖神經網路提出了新的傳播模型;Wang等人[17]進一步改進了傳播模型,即邏輯注意力網路(Logic Attention Network,LAN),以考慮實體鄰域的無序性和不平等性質,從而更好地學習實體和對應的鄰實體之間的關係。與以上研究不同的是,Hu等人提出了一種利用實體描述作為輔助文字的知識圖譜表示學習方法Teger,如圖1(d) 所示,它一方面利用GCN對輔助文字中的區域性語義關係和長距離語義關係進行編碼,另一方面基於TransE學得知識圖譜的結構資訊,從而透過結合兩種途徑得到了更精確的實體表示。GENI(GNN for Estimating Node Importance)[18]為了估計知識圖譜中實體的重要性,提出了鄰實體的重要性分數(而不是鄰實體的特徵)對中心實體的重要性評估起主要作用的觀點,因此設計了預測感知的注意力機制和靈活的中心性調整策略,使重要性分數進行傳播,而非實體表示。

基於圖神經網路的知識圖譜研究進展

資訊抽取

資訊抽取是指從非結構化、半結構化文件或句子中提取結構化資訊的技術,與知識圖譜的構建有著密切的聯絡,主要包括命名實體識別、實體消歧、關係抽取、指代消解等任務。近年來,已有許多研究將圖神經網路應用於知識圖譜的關係抽取任務,而在其他任務上對圖神經網路的探索還較少。透過圖神經網路可以對句子內或句間詞與詞的關聯關係進行有效建模,從而更準確地捕捉實體間的關係。

關係抽取,即從文字中識別抽取實體對之間的語義關係。例如,從句子“[賈玲],80後相聲新秀,師承中國著名相聲表演藝術家[馮鞏]”中識別出實體“[賈玲]”和“[馮鞏]”之間具有“師生”關係。在關係抽取中,許多工作基於句子的依賴樹使用GCN對詞之間的依賴關係進行編碼,或基於知識圖譜表示進行句子編碼,從而預測關係類別。如圖2(a) 所示,C-GCN(Contextualized GCN)[19]是一種基於上下文的GCN模型,該模型將句子的依賴樹進行剪枝,只保留與實體對的依賴關係路徑部分;基於注意力的圖卷積網路(Attention Guided Graph Convolutional Network,AGGCN)[20]也在句子的依賴樹上使用GCN模型,但採用了多頭注意力機制以一種軟加權的方式對邊(依賴關係)進行選擇,如圖2(b)所示;與之前兩個基於依賴樹的模型不同,Zhang等人[21]將GCN用於編碼關係的層次結構,提出了一種由粗到細粒度的知識感知注意機制以提高關係抽取的效果,如圖2(c)所示。以上三種方法均用於單句上的關係抽取,而薩胡(Sahu)等人[22]則將包含多個句子的整個文件進行構圖,如圖2(d)所示,圖中的節點代表單詞,邊代表多種單句內和跨句間的關係,然後應用GCN更新圖節點的表示,從而進行跨句關係抽取的任務。

基於圖神經網路的知識圖譜研究進展

實體消歧,即對於從文字中抽取得到的實體物件,將其連結到知識庫中對應的正確實體物件。如圖3所示,Hu等人[23]提出了一種圖神經實體消歧模型(Graph Neural Entity Disambiguation, GNED),首先為文件構造實體–詞異質圖,對文件中的實體之間的語義關係進行編碼;然後將GCN應用於該異質圖,獲得語義資訊增強的實體表示;最後採用條件隨機場來結合實體連結的區域性和全域性資訊。

基於圖神經網路的知識圖譜研究進展

實體對齊

實體對齊是將從知識圖譜中學習到的描述同一目標的實體或概念進行合併,再將合併後的實體集與開放連結資料中抽取的實體進行合併,旨在融合多個知識圖譜形成一個更完整的知識圖譜。由於圖神經網路具有識別同構子圖的能力[24],而可對齊的實體對周圍通常有相似的鄰居,即具有一定的同構特徵,因此目前有許多研究者嘗試將圖神經網路用於實體對齊。

Cao等人[25]提出了一種新的多通道圖神經網路模型(Multi-Channel Graph Neural Network,MuGNN),來為兩個不同的知識圖譜中的待對齊實體學習魯棒表示。該模型還對規則進行了推斷和傳遞,以進一步增強兩個知識圖譜的一致性。Zhang等人[26]提出了一種統一的框架LinKG來合併不同來源的知識圖譜,同時為了將歧義性強的實體(如人名)正確對齊,還提出了一種異質圖注意力網路(Heterogeneous Graph Attention Network),在相關的子圖上學習每對候選者是否匹配。Sun等人[27]指出大量的對應實體對不具有同構的鄰居結構,導致圖神經網路為此類實體產生的實體表示並不匹配,由此提出AliNet(Alignment Network),基於注意力機制引入了遠距離的鄰居以擴充套件鄰居結構的重疊部分,增強了對應實體對的同構性。在實體對齊中有一類特殊的子任務,即跨語言實體對齊。Wang等人[28]透過多個GCN實現跨語言實體對齊。該方法分別使用一個GCN將每種語言的實體和關係分別嵌入到一個統一的空間中,從而為屬性和結構都學習一個表示,最後基於這兩種表示進行實體對齊。與之不同的是,Xu等人[29]基於給定實體的鄰域子圖,將實體對齊問題轉化為了圖匹配問題,提出了一種基於圖注意力的方法,對兩個實體子圖中的所有實體進行匹配,並對區域性匹配資訊建模,最終得到一個圖級別的匹配向量。

連結預測

連結預測是用於預測知識圖譜中實體對之間所缺少關係的任務,具有廣泛的應用範圍,旨在解決知識圖譜不完整的問題。連結預測與知識圖譜表示學習有著不可分割的聯絡,一方面表示學習通常需要用連結預測評價優劣[10,15],另一方面連結預測的模型通常也會學得實體和關係的表示。許多工作利用圖神經網路為實體引入鄰實體和對應關係的資訊,學得更全面的實體表示,從而更準確地預測實體之間的連結關係。

GMatching[30]開發了一種基於度量小樣本學習方法,它利用R-GCN[10]為單跳鄰居進行編碼從而捕捉區域性的圖結構資訊。由於R-GCN的一個不足之處是平等地對待鄰域中的不同實體,SACN(Structure-Aware Convolutional Network)[31]引入了加權GCN來定義具有相同關係型別的兩個相鄰實體之間的相關性,利用節點結構、節點屬性和關係型別來獲取知識圖譜中的結構資訊,最後送入解碼器Conv-TransE來預測關係是否成立。解碼器採用ConvE[32]來度量語義的匹配程度,同時還可以獲得TransE[14]的翻譯特性。目前常見的學習個性化權重的方式是引入注意力機制,因此納撒尼爾(Nathani)等人[33]引入GAT[8]使得連結預測時可以在利用鄰實體資訊的同時,依據多頭注意力機制為不同鄰實體分配不同的權重。Zhang等人[34]進一步提出了一種基於層次注意力的關係圖神經網路(RGHAT),第一層是關係級別的注意力,其靈感來自不同關係對某一實體的指示權重不同的直覺;第二層是實體級別關注,使得模型能夠突出同一關係下不同相鄰實體的重要性。G2SKGE[35]採用了實體和對應的鄰域構建子圖,並設計了一種資訊融合機制圖到序列(Graph to Sequence generator,Graph2Seq),從而利用圖神經網路的框架來學習知識圖譜中的實體表示。

知識推理

與連結預測相似,知識推理是從給定的知識圖譜中推匯出實體與實體之間的新關係,但知識推理所獲得的關係通常需要在知識圖譜中進行多跳的推理過程。知識推理是一些下游任務的重要支撐之一,例如知識庫問答[1~3]。由於圖神經網路在推理能力上的優勢[13],近年來被一些研究者嘗試用於知識推理任務。

Xu等人[36]提出了一種用於大規模知識圖譜推理任務的圖神經網路(Dynamically Pruned Message Passing Network,DPMPN),如圖4(a)所示,它包含兩個遵循訊息傳遞神經網路[37]架構的模組,其中一個用於全域性的資訊傳播,另一個用於區域性的資訊傳播。Zhang等人[38]提出了一個名為ExpressGNN的圖神經網路用於機率邏輯推理,它將馬爾可夫邏輯網路(Markov logic network)[39]引入到了圖神經網路框架,從而將邏輯規則和機率圖模型與圖神經網路結合在一起。Lin等人[1]提出了一個基於圖的關係推理模型KagNet(Knowledge-aware graph Network),如圖4(b)所示,該模型使用GCN更新知識圖譜中的實體表示後,利用長短期記憶網路(Long Short-Term Memory,LSTM)為候選路徑打分,從而選出最佳的推理路徑。如圖4(c)所示,認知圖譜問答(CogQA)[3]則使用BERT(Bidirectional Encoder Representations from Transformers)輸出的若干片段構建一個認知圖譜,並利用圖神經網路的資訊傳播機制,實現在認知圖譜上的多跳推理計算。

基於圖神經網路的知識圖譜研究進展

3 基於圖神經網路的知識圖譜應用

描述常識和事實的知識圖譜是學術界和工業界廣泛使用的知識表示方式,採用圖構建知識和資料之間的關聯,是一種直接且有效的將知識和資料結合的方式。受益於圖神經網路技術在資訊傳播和推理上的優勢,知識圖譜中的先驗知識被有效地引入到應用任務中。

文字挖掘

知識圖譜由自然語言構建而來,因此與文字挖掘的聯絡頗深。知識圖譜在大部分的文字挖掘任務中都有大量的應用,其中應用最廣泛的是知識庫問答任務。在文字分類、文字生成等任務中,知識圖譜也都扮演了非常重要的角色。

知識庫問答是對知識圖譜最直接的應用任務,即基於知識圖譜中的結構化知識,分析使用者自然語言問題的語義,進而在知識圖譜中透過檢索、匹配或推理等方式進行回答。由於圖神經網路在推理能力尤其是多跳推理上的優勢[13],已有大量工作將圖神經網路用於知識庫問答任務。KagNet[1]尋找實體之間的潛在路徑並對其打分來確定最佳路徑,從而選出最佳答案。首先基於知識圖譜將問題抽取為結構化的圖,並基於外部知識圖譜擴充套件為該問題的相關子圖,然後使用GCN更新節點表示,最後使用LSTM為路徑打分,即選出最佳的推論。CogQA[3]根據人類的認知方式1設計了兩個模組,分別對應於人類的兩種認知模式,模組一基於BERT在文字中抽取與問題相關的實體名稱,並擴充套件節點和彙總語義向量;模組二則利用圖神經網路在模組一中構建的認知圖譜上進行多跳推理計算。De Cao等人[2] 首先根據涉及的實體進行構圖,然後根據文件內和跨多個文件傳播的資訊使用GCN進行聚合和多步推理。類似地,Ye等人[40]提出知識增強圖神經網路(Knowledge-enhanced Graph Neural Network,KGNN),利用知識圖譜中的關係事實為段落中的實體構建實體圖譜,從而使用圖神經網路對多個段落進行推理。Lv等人[41]使用結構化的ConceptNet和非結構化的Wikipedia作為兩個外部知識源,並根據問題和答案選項,從兩個知識源中抽取出證據並依此構建為圖,然後使用GCN更新節點表示並使用注意力機制融合得到圖級別的表示,最後用於答案的推斷。

在文字分類[12]、文字生成[42,43]、分類法構建[44]等任務中,引入知識圖譜中的先驗知識,可以使模型更準確地理解自然語言的含義。Hu等人[12]提出了一種異質圖神經網路HGAT(Heterogeneous Graph Attention Network)用於短文字分類,如圖5所示,首先基於知識庫構造包含短文字、實體、主題三類節點的短文字異質圖,從而利用知識庫中的知識增強短文字中的資訊,設計了一種帶有雙層注意力機制的異質圖神經網路,用於獲得知識增強的短文字表示,從而提高分類效果。Hu等人還將HGAT用於虛假新聞檢測,提出由於虛假新聞的虛假性特徵,會導致所含實體的表示會與知識庫中的實體表示有較大差異,因此透過HGAT學習融合了新聞內容的實體表示,並透過一個匹配網路模組度量與知識庫中的實體表示之間的差異性,從而提高檢測效果。Koncel-Kedziorski等人[42]提出了一種新的圖轉換器(graph transformers)用於編碼知識圖譜中包含的節點、關係資訊,從而結合給定的待生成文字標題,利用解碼器實現對應文字的生成。Chen等人[43]提出了一種雙向Graph2Seq模型,利用知識圖譜中的結構資訊,使用雙向門控圖神經網路(Bidirectional Gated Graph Neural Network,BiGGNN)學習圖譜節點表示,以一種帶有節點級別的複製機制的LSTM作為解碼器來生成文字。Graph2Taxo[44]是一種基於圖神經網路的跨域知識遷移框架,用於分類法構建的任務,它使用一個由上下位詞候選對構造的有噪聲圖,以及一些已知域的一組分類,利用圖神經網路指導未知領域的分類結構學習。

基於圖神經網路的知識圖譜研究進展

推薦系統

為了解決推薦系統中的稀疏性問題和冷啟動問題,一種可行的思路是將知識圖譜作為外部資訊整合到推薦系統中,使推薦系統具有常識推理能力。研究者們基於圖神經網路強大的聚合資訊以及推理能力,設計了基於圖神經網路和知識圖譜的推薦系統,有效地提升了推薦命中率。此外,圖神經網路的資訊傳播與推理能力也為推薦結構提供了一定的可解釋性。

RippleNet[45]將知識圖譜特徵學習和推薦演算法的目標函式結合,使用端到端的方法進行聯合學習,從而將知識圖譜作為額外資訊融入至推薦系統。如圖6(a)所示,知識圖譜卷積網路神經網路(Knowledge Graph Convolutional Network,KGCN)[46]透過擴充套件知識圖譜中每個實體的感受野,捕捉使用者的高階個性化興趣,同時對商品之間的潛在聯絡建模,從而提高推薦的準確性。如圖6(b)所示,知識圖譜注意力網路(Knowledge Graph Attention Network,KGAT)[47]進一步引入知識感知的注意力機制,從融合知識圖譜的使用者–商品互動圖中傳播高階連結路徑的資訊。Wang等人[48]提出了基於標籤平滑正則的知識感知圖神經網路(KGNN-LS),首先將知識圖譜轉換為使用者相關的帶權圖,然後使用該圖神經網路計算個性化的商品嵌入,從而提升推薦效果。

基於圖神經網路的知識圖譜研究進展

計算機視覺

人類區別於現代計算機視覺演算法的一個特徵是獲得知識並使用該知識推理視覺世界的能力,從而可以透過很少的例子認知視覺世界[49]。研究者們考慮到圖神經網路在學習節點和邊的表示方面的優勢,應用了圖神經網路來學習利用影象中的目標與知識圖譜之間的關聯關係。

馬連奴(Marino)等人[49]首先根據大規模影象資料集中的一些先驗知識構建了一個知識圖譜,如圖7(a)所示,包括目標–屬性和目標–目標之間的關係,並基於該結構化的先驗知識,提出了圖搜尋神經網路(Graph Search Neural Network),將先驗知識引入影象分類從而提高分類效果。類似地,如圖7(b)所示,Wang等人[50]提出了圖注意力機制來從影象中識別社交關係,首先根據大規模影象資料集構建了一個描述社交關係和目標共現的知識圖譜,然後採用門控圖神經網路(Gated Graph Neural Network,GGNN)利用該知識圖譜中的語義結構資訊學習更準確的節點和關係表示,從而提高了影象中社交關係識別的效能。Wang等人[51]則使用從知識圖譜中學得的標籤語義嵌入和標籤間的關係,將一種多層GCN訓練為一個零樣本影象分類器。

基於圖神經網路的知識圖譜研究進展

4 總結與展望

結合知識圖譜和圖神經網路的相關研究已經成為人工智慧領域的一個熱點方向。知識圖譜可以為各類學習任務提供良好的先驗知識,圖神經網路則可以更好地支援圖資料的學習任務。但是,目前基於圖神經網路的知識圖譜學習、計算與應用的研究都還相對較少,未來仍有巨大的發展空間,例如基於圖神經網路的知識圖譜自動構建、基於異質圖神經網路的知識融合、基於元路徑或圖神經網路的知識圖譜複雜推理、基於圖神經網路的可解釋性學習等。

自動構建

當前的知識圖譜高度依賴於人工構建,構建特定領域的知識圖譜又是企業應用裡不可或缺的現實需求。在學習建模實體的時間資訊和實體動力學方面,已有一些基於傳統深度學習的工作,但通常無法將知識圖譜作為一個整體對其動態性進行建模。因而,利用最近的一些動態圖神經網路的方法例如圖時空網路,同時建模並預測微觀層面上的實體以及宏觀層面上的圖譜的變化規律,是一個值得關注的方向。

融合知識

採用圖構建知識和資料之間的關聯從而引入知識圖譜,是目前研究的一種主流思路之一。通常,真實資料中的互動關係有豐富的屬性特徵(如使用者–商品互動圖中使用者和商品都帶有豐富的屬性特徵),而知識圖譜則是關係特徵豐富的,即相對更側重於結構性。此外,知識圖譜中的本體概念層包含大量的謂詞邏輯規則知識,如何設計更合適的圖神經網路模型彌補這三者之間的語義鴻溝,從而更好地融合知識圖譜中的先驗知識,將是一個研究難點。一種直接的思路是利用異質圖神經網路的方法,考慮節點的異質性和多模態性,從而用適合各型別的不同方式對不同的資訊進行融合。

複雜推理

由於基於嵌入的方法在複雜的邏輯推理上有侷限性,因而可以進一步探討關係路徑和符號邏輯兩個方向。異質圖上的元路徑定義了高階的語義關係,而知識圖譜可看作一種特殊的異質圖,將基於異質圖神經網路的訊息傳遞與基於強化學習的路徑查詢和約減相結合,是一種可行的處理複雜推理的思路。研究者們最近的工作將機率圖模型(如馬爾科夫網)與圖神經網路相結合,旨在訊息傳遞時發現並推理邏輯規則,而利用此類模型挖掘知識圖譜上的推理規則,也是一個值得注意的研究方向。

可解釋性

深度學習的黑盒問題被人詬病已久,圖神經網路的資訊傳播機制相較傳統深度學習模型更具有可解釋性。知識圖譜提供了現實世界的事實知識,利用圖神經網路模型尤其是機率圖神經網路應用在知識圖譜中實現邏輯推理,從而顯式地生成基於知識圖譜的推理路徑,或許可以期待開啟深度學習的黑盒。

腳註

1 雙過程理論(dual process theory)認為,人的認知分為兩個系統,其一是基於直覺的、無知覺的思考系統,其運作依賴於經驗和關聯;其二是人類特有的邏輯推理能力,此係統利用工作記憶中的知識進行慢速但是可靠的邏輯推理。