聰明過人!獼猴也會玩街機經典“吃豆人”,甚至運用複雜策略挑戰高難度關卡

猴子究竟有多聰明?科學家發現,在吃豆人遊戲中,它不僅會簡單決策,還能進行分層決策,甚至將不同策略組合成複雜策略,來解決難度更高的關卡。

日前,《eLife》線上發表了來自中國科學家的題為《獼猴在吃豆人遊戲中的分層組合策略》的研究論文。

該論文將複雜的行為正規化和人工智慧建模結合,定量研究了獼猴解決複雜問題的啟發式行為策略特點,為理解大腦實現高階認知功能的計算機制提供了全新方法和重要啟發。

聰明過人!獼猴也會玩街機經典“吃豆人”,甚至運用複雜策略挑戰高難度關卡

(圖片來源:jpbeta。cc)

日常生活中,人們大部分的重要目標通常都無法僅用簡單決策來實現,往往需要透過設計一系列縝密的基礎策略組合來實現。

研究動物的複雜行為和潛在的神經機制,是神經科學和認知科學領域持續受到關注的一個科學問題,但目前大部分的動物行為正規化複雜程度,都不足以支援如此複雜的高階認知策略研究。

中國科學院腦科學與智慧技術卓越創新中心(神經科學研究所)、靈長類神經生物學國家重點實驗室楊天明研究組,設計了一種新穎有趣的實驗正規化——吃豆人遊戲,並且訓練獼猴學會使用搖桿完成該遊戲正規化的主要任務。

聰明過人!獼猴也會玩街機經典“吃豆人”,甚至運用複雜策略挑戰高難度關卡

▲(A)吃豆人行為正規化。(B) 獼猴用分層決策的策略解決吃豆人任務。該策略在最低級別,為操縱桿的移動做出決定:向上、向下、向左或向右。在中間層,在策略基組之間進行選擇。在更高的層次上,可以將簡單的策略拼湊成更復雜的複合策略基組。

為解決這些問題,該研究改編經典街機遊戲吃豆人(圖A),並訓練獼猴學會使用操縱桿來控制吃豆人在一個封閉的迷宮中運動收集食物,獼猴避開敵人追擊將獲得實時果汁作為獎勵。

在經過訓練後,獼猴就能夠理解遊戲中各個元素和獎勵懲罰之前的關聯,並依次相應地做出連續的運動抉擇,來躲避敵人的追擊,獲取更多的獎勵,甚至在特定規則下對敵人實現反殺。

這麼複雜的遊戲,為何會讓獼猴有興趣學習並不斷進階?楊天明認為,該遊戲雖然高度動態且複雜,但其本質上還是比較接近於動物野外覓食,貼近動物天性,“這或許是該研究成功訓練動物的關鍵要素”。

為定量地描述獼猴行為策略的特點,研究人員利用機器學習和統計方法,動態擬合匹配遊戲玩法與多個智慧策略模型,該模型對獼猴手柄運動的預測準確率能夠達到90%以上。

結果發現,

獼猴會透過使用分而治之的啟發式方法,在每個時間只關注遊戲的一個子任務,分散式地解決這些問題,從而實現對遊戲總體目標的最佳化。

更令人感到吃驚的是,研究發現

獼猴能夠在時序上組合一些簡單策略基組,構建更為複雜的複合策略,來處理特定的更有挑戰性的任務。

以上的研究結果表明,

獼猴能夠最佳化掌握一套策略基組,並採用分層決策的方式來解決十分複雜的任務

(圖B)。

本研究著眼於系統認知神經科學和人工智慧廣泛關注的交叉領域,將複雜的行為正規化和嚴謹的計算建模進行結合,為未來研究靈長類動物的高階認知提供了重要的實驗證據和新穎的分析方法。

作者:許琦敏

圖片:受訪者提供

*文匯獨家稿件,轉載請註明出處。