Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖形神經網路(GNNs)通常將其計算圖與輸入圖的結構相一致。但是,圖是 GNN 的正確計算結構嗎?最近的一系列論文挑戰了這一假設,用來自代數拓撲學領域的更普遍的物件取代了圖,這提供了多種理論和計算優勢。

作者 | Michael Bronstein等人

編譯 | 黃楠 、bingo

編輯 | 陳彩嫻

本文由Cristian Bodnar 和Fabrizio Frasca 合著,以 C。 Bodnar 、F。 Frasca 等人發表於2021 ICML《Weisfeiler and Lehman Go Topological: 資訊傳遞簡單網路》和2021 NeurIPS 《Weisfeiler and Lehman Go Cellular: CW 網路》論文為參考。

本文僅是透過微分幾何學和代數拓撲學的視角討論圖神經網路系列的部分內容。

從計算機網路到大型強子對撞機中的粒子相互作用,圖可以用來模擬任何東西。圖之所以無處不在,是因為它們具有離散性和組合性,這使得它們能夠表達抽象關係,同時又易於計算。它們受歡迎的原因之一是圖抽象出幾何圖形,即節點在空間中的位置或邊緣是如何彎曲的,只留下節點如何連線的表示。

圖論起源於萊昂哈德 · 尤拉(Leonhard Euler)在1741年的著作《geometria situs》中的觀察,他指出著名的柯尼斯堡七橋問題問題沒有解決方案。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:七橋問題要求在哥尼斯堡市內找到一條迴圈行走的路線,不需要多次過橋。正如尤拉所說,哥尼斯堡市的確切形狀並不重要,重要的是不同的土地(圖的節點)是如何相互連線的(邊)。尤拉表明,當且僅當所有節點具有偶數度時,這樣的迴圈才存在。另外,最初的橋樑中只有五座存活到現代。圖源:維基百科

有趣的是,尤拉的發現不僅標誌著圖論的開始,而且也常常被認為是拓撲學誕生的標誌。與圖一樣,拓撲學家對空間的那些與其特定形狀或幾何形狀無關的屬性感興趣。

這些思想的現代表現形式出現在1895年的“分析地點” (Analysis situs),這是 Henri Poincaré 的一篇開創性的論文,他的工作點燃了對流形的組合描述的興趣,從這些流形中可以更容易地找到和計算拓撲不變數。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:Leonhard Euler(1707-1783)和 Henri Poincaré(1854-1912)

這些組合描述今天被稱為細胞複合體 ,可以被認為是圖的高維概括。

與由節點和邊形成的圖不同,細胞複合體也可以包含更高維的結構或“細胞”:頂點是0-細胞,邊是1-細胞,2D 表面是2-細胞等。為了構建一個細胞複合體,我們可以透過將一個細胞的邊界粘合到其他低維細胞上來進行分層。

在特殊情況下,當單元格由單形(如邊、三角形、四面體等)構成時,這些空間也稱為單形複合體。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:圖可以看作是我們附加邊(1-單元格)的一組頂點。類似地,單細胞複合體和細胞複合體可以看作是我們連線2-細胞(藍色顯示)、3-細胞(綠色顯示)等的圖形。

1

機器學習與資料科學中的拓撲

我們認為,人們不必等待 400 年才將把拓撲學變成一種實用的工具。

在拓撲資料分析(TDA)的保護傘下,諸如淺層複合物這樣的拓撲結構已經被用於機器學習和資料科學,這類方法出現在20世紀90年代,試圖以一種對度量不敏感和對噪聲穩健的方式來分析“資料的形狀”。

TDA的根源可以追溯到20世紀20年代末最多產的拓撲學家之一 Leopold Vietnam oris 的工作。然而,這些技術必須等到現代計算的誕生才能大規模應用。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:給定一個點雲,每個點周圍固定半徑的封閉球之間的交叉點產生一個簡單的複合體。透過逐步增加球的半徑,我們可以得到一個巢狀的簡單複合體序列。圖源:Bastian Rieck。

TDA 的主力是永續性同源性(PH),一種從點雲中提取拓撲特徵的方法。給定一個點的資料集,PH 建立一個簡單複數的巢狀序列,其中每個複數對應於分析基礎點雲的某個比例。然後,它跟蹤各種拓撲特徵(例如,連線的元件、迴圈或空洞) ,這些特徵隨著比例的逐漸增加而出現和消失,並且人們從序列中的一個複合物過渡到下一個複合物。

在深度學習時代,

永續性同源性有了“第二次生命”,因為它表明人們可以透過它進行反向傳播,從而允許將已經建立的 TDA 裝置整合到深度學習框架中。

最近的一系列工作提出了在幾何深度學習中簡化和細胞複合體的不同用途,作為一個更豐富的底層拓撲空間來支援資料和對其進行的計算。

最早利用這一觀點的幾項工作提出了卷積模型以及在簡化複合體上操作的隨機行走方法。如在本文中,卷積模型可以被理解為簡單和細胞複合體上資訊傳遞的具體例項。

由於計算是由這些空間的拓撲結構(即鄰域結構)驅動的,我們把這套方法稱為拓撲資訊傳遞。在這個框架中,相鄰的單元,可能是不同維度的,正在交換資訊,如下圖所示。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:拓撲資訊傳遞示意圖。藍色箭頭描述了上層相鄰細胞之間的“水平”資訊傳播,即同一高維細胞的邊界上的細胞。紅色箭頭描述了“垂直”資訊傳播,即細胞從其邊界的低維細胞中接收資訊。將來自邊界細胞的資訊彙總到一個更粗的表示中,這種計算可以被解釋為一種(可微分的)集合形式。

在 GNN 中超越圖

儘管細胞複合體提供了豐富的結構,但我們不能忽檢視是迄今為止機器學習中最常見的拓撲物件,而且很少有資料集能超越它們。儘管如此,人們仍然可以透過轉換輸入圖來利用這些有趣的拓撲空間。

我們把將圖轉換為高維拓撲空間稱為“提升”,以類似於範疇理論中的同名概念。它是一種轉換,透過遵循某些規則將高維單元附加到輸入圖上。例如,一個圖可以透過在圖的每個懸崖或週期上附加一個高維單元而被提升為一個單元複合體。透過這樣做,圖被替換成一個不同的空間,它有更多的結構,可以為GNN提供一個比原始圖更好的計算結構。在下文中,我們將討論這種方法的具體優勢。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:透過將二維封閉圓盤的邊界粘合到圖中的誘導迴圈上,可以從圖中構造出高維的細胞複合體。

在 GNN 中超越圖

GNN通常採用以節點為中心的觀點,駐留在邊上的資料僅被視為增加頂點間通訊的輔助資訊。在拓撲資訊傳遞中,所有單元都是一等公民。無論它們的維度如何,它們都被分配了一個特定的表示,這個表示是透過與相鄰的單元交換資訊而發展起來的。這為明確地模擬某些高階結構和它們之間的相互作用提供了一個秘訣。特別是,

它提供了一種原則性的方法來演化輸入圖的邊緣(即1個單元)特徵,這是一大類 GNN 模型沒有考慮到的問題。

高階特徵和結構

圖表根據定義是二元的(“成對的”),不能表示涉及兩個以上物件的關係和互動。在對以高階相互作用為特徵的複雜系統進行建模時,這可能是一個問題:例如,化學反應中的三種反應物可能同時發生相互作用。在細胞複合體中,這種情況可以透過兩個細胞(即“填充”三角形)連線反應物來編碼。因此,模型的計算流程適應高階互動的存在。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:細胞 Weisfeiler-Lehman(CWL)測試,將經典的WL測試擴充套件到細胞群,演算法的每一步都完美地散列了相鄰單元的顏色(可能有不同的維度)。

高階特徵和結構

資訊傳遞 GNN 的表達能力受 Weisfeiler-Leman (WL) 圖同構測試限制,眾所周知,WL 無法檢測某些圖子結構,例如三角形或迴圈,即使是非常簡單的非同構圖也無法區分。

據此前的論文顯示

(論文地址:https://arxiv。org/abs/2103。03212;https://arxiv。org/abs/2106。12575),

WL 測試 (CWL) 的細胞版本可用於測試細胞複合物的同構性。當這個新測試與上面描述的圖提升過程相配時,可以發現,它能比 WL 測試區分更大的圖類。因此,在一定條件下,拓撲

息傳遞過程繼承了該測試的優點,相比標準 GNN 提高了表達能力。

高階互動

資訊傳遞的 GNN 需要n個層來使相距n個跳數的節點進行通訊。當僅使用幾層,以至於相距較遠的節點無法交換

息時,這種現象稱為未達到。

相比之下,使用太多層可能會導致過度平滑,且資訊可能會在圖的結構瓶頸中丟失。

單元複合體可以緩解這些問題,因為由高維單元誘導的更豐富的鄰域結構,在可能相距很遠的節點之間建立了捷徑。因此,資訊只需包含一些計算步驟來傳播,就是有效的。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:GNN 需要很多層才能使相距很遠的節點進行通訊(左)。高維單元透過建立捷徑來改變空間的底層拓撲結構(右)。這允許遠端節點在幾個資訊傳遞步驟中交換資訊。

高階互動

拓撲

息傳遞執行的計算是分層的,資訊從低維單元流向高維單元並返回,可看作是“垂直”(和可區分)池的一種形式,而非標準圖神經網路中的“水平”池。這保持了“壓縮”圖區域的歸納偏差,而不會忽略輸入圖的會損害基於 GNN 池效能的細粒度資訊。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:拓撲資訊傳遞允許資訊存在於不同維度的單元之間分層

表現力

某些應用自然與細胞複合物的結構一致,例如,分子的原子、鍵和化學環可以表示為 0-cell、1-cell 和 2-cell,分子的物理結構和細胞的複雜表示之間的直接對應,允許了拓撲資訊傳遞利用上述特性,這些表示也展示了拓撲

息傳遞在分子特性預測任務中所實現的最先進結果 。

其他表現良好對齊的應用程式,可能包括計算機圖形應用程式中的離散流形(網格)、社交網路(派系特別重要)或空間圖,例如谷歌地圖(街道間的街區可被自然地表示為“立方”細胞) 。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:咖啡因子被建模為二維細胞複合物

表現力

拓撲資訊傳遞中,保留了許多與代數拓撲學、微分幾何學的有趣聯絡,允許使用迄今為止仍在圖和幾何深度學習中沒有得到充分開發的數學工具。

不足、過度平滑和瓶頸

在代數拓撲中,通常使用有向單純復形,其中每個單純形存在任意“定向”,例如,我們選擇每條邊中的一個源節點和一個目標節點,並對每個三角形選一個遍歷其節點的順序。一旦選定方向後,就可對復形執行有趣的代數運算元,例如透過“邊界運算元”計算某些單純形的邊界。這些代數運算也可以用來在單純復形中找到“洞”——沒有邊界但不在其他事物邊界上的區域。其背後,持久同源依靠這些計算來檢測拓撲特徵。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:應用於 2-單純形的邊界運算元產生一個三角形。再次將運算元應用於三角形,結果為零,由於三角形是一個迴圈,因此它沒有邊界。

拓撲資訊傳遞可以看作是代數運算元(例如邊界運算元)的(非線性)推廣。因此,拓撲

息傳遞表現類似是有必要的:我們希望各層的輸出能夠“一致”地響應輸入複合物方向的變化。換句話說,我們希望我們的層是方向等值的。在工作中,我們研究了拓撲

息傳遞是如何透過選擇合適的非線性和

息傳遞函式來滿足這一特性,同時,純卷積設定中也對這一點進行了研究。

不足、過度平滑和瓶頸

最早已知的拓撲不變數之一、尤拉特徵,最初用於柏拉圖固體的分類,我們可以將其定義為每個維度中單元格數量的交替總和。令人驚訝的是,如果兩個細胞複合體是同胚的,即便它們是同一空間的不同離散,這些和也將是一致的。

有趣的是,拓撲資訊傳遞模型的讀出操作,使其能很容易計算出該拓撲的不變性,因為它對每個維度單元應用了一個可包容不變數的還原。

因此,這類模型在構造上可以區分某些非同構的空間(即具有不同的尤拉特徵)。從計算的角度來看,這可以被看作是 WL 測試的一種推廣,在 WL 測試中,我們不僅僅對確定兩個細胞複合物是否相同感興趣,也對它們是否彼此同構感興趣。

分層建模

分層建模

為細胞複合物的拓撲性質提供了一個更幾何的解釋。當與k-細胞相關的特徵符號取決於k-細胞的方向時,這些特徵在數學上可被看作是微分幾何中的微分k-形的離散版本(即可以被整合的k維體積元素)。一個被稱為霍奇拉普拉斯的運算元概括了圖形拉普拉斯,它可作用於這些微分形式。可以證明,

基於此拉普拉斯運算元的擴散 PDE ,會在極限內收斂與複合物的洞的有關訊號 。

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

圖注:基於霍奇拉普拉斯運算元的擴散偏微分方程,收斂於初始微分形式在拉普拉斯運算元核上投影的極限。該影象顯示了霍奇拉普拉斯運算元的零特徵向量是如何在複合體中的洞周圍取高值。

第一個簡單的神經網路模型實際上是基於霍奇拉普拉斯的卷積模型,反之,又受到拓撲訊號處理的啟發。就在最近,基於該運算元的一個版卷積模型被用於解決計算代數拓撲學中的NP-hard問題。

域對齊

域對齊

2拓撲學和微分幾何學的結合

最近有論文認為,除其他外,拓撲資訊傳遞方法不過是在編碼細胞複合體結構的修正圖上操作資訊傳遞的 GNN 。這對卷積模型來說是正確的,其資訊傳遞計算涉及到成對的單元格。

然而,在其最一般的形式中,

息函式允許高維單元格調製其邊界上的低維單元格之間傳遞的

息。一般情況下,能透過圖上的常規

息傳遞,因為一條邊正好連線兩個節點,而一個2-單元格可以任意連線多的邊。

在這兩種情況下,計算都是由資料所依附的底層空間的拓撲結構所驅動的。我們相信,在資訊傳遞上採用這種拓撲視角所帶來的好處,要超出純粹的計算考慮。除了有價值的數學聯絡外,它還為其他數學和計算學科打開了研究話語,有利於我們經常過於單調的社群之間的積極交叉融合。

2

我們預計拓撲資訊傳遞方法的兩個主要未來方向:

第一,多年來在GNN中開發的許多架構(如注意力機制)可能會在這些新的拓撲空間中被採用,同時可利用它們的特定特徵。

其次,來自代數拓撲領域的更多數學物件和工具(包括諸如蜂窩滑輪之類的結構,即使是最精通數學的 ML 研究人員,對他們來說可能聽起來也很陌生)將被圖和幾何深度學習社群採用。

這些方法既可以為老問題提供答案,也可以幫助解決新問題,正如Robert Ghrist 所說:「novel challenges necessitate novel math」(新的挑戰需要新的數學)。

拓撲學和微分幾何學的結合

https://towardsdatascience。com/a-new-computational-fabric-for-graph-neural-networks-280ea7e3ed1a

Michael Bronstein從代數拓撲學取經,提出了一種新的圖神經網路計算結構!

雷峰網