比人類還聰明？這種AI靠自學就會玩魔方，百分百成功且只需20步

人工智慧已經能在很多方面勝過人類，比如下圍棋、象棋、打撲克牌……近日，一種深度學習演算法已經被開發出來，它可以比任何人更快地解魔方。

它從來沒有失敗過，達到了100%的成功率，而且可以把步驟控制在約20步。

人類可以打破人工智慧18秒的紀錄，世界紀錄大約是4秒，但人類的效率要低得多，通常需要50步左右。

它是由加州大學歐文分校發明的。

這種新方法解決了計算機科學中的一個重要問題——如何使用這個名為DeepCube A的系統，在獲得的幫助最小的情況下解決複雜的問題。

在《自然機器智慧》（Nature Machine Intelligence）今天發表的一項研究中，研究人員證明，DeepCubeA能夠100%解決所有測試問題，並在大約60%的時間裡找到了通往目標狀態的最短路徑。

來自加利福尼亞大學的Pierre Baldi和他的同事們從之前的DeepCube專案中開發了DeepCubeA。

使用一種名為“自行迭代學習法”（autodidactic iteration）的新型深度學習技術，透過建立自己的獎勵體系來自學。

Baldi教授說：“人工智慧可以打敗世界上最好的人類象棋和圍棋選手，但一些更難的謎題，比如魔方，還沒有被電腦破解，所以我們認為這些領域對人工智慧的嘗試是開放的。”

“魔方的解決方案涉及到更多的符號、數學和抽象思維，因此能夠破解這樣一個謎題的深度學習機器，正越來越接近成為一個能夠思考、推理、計劃和決策的系統。”

給定一個未解的多維資料集，機器必須確定特定的移動是否是對現有狀況的改進。它透過結合強化學習和尋路的方法，在沒有人類幫助的情況下解決謎題。

與傳統演算法相比，DeepCubeA使用更少的記憶體，能夠在大多數情況下識別出謎題的最短路徑。

作者表示，它可以解決魔方、熄燈遊戲（Lights Out）、推箱子（Sokoban）和更大的問題，包括一個48片的滑動拼圖。

經過訓練後，網路使用一個標準的搜尋樹來搜尋每個狀況下的建議動作。

使用相同方法能解決的遊戲範圍很廣，這意味著它可以用於更大的問題，以找到接近最優解。解決含有大量組合的謎題，也有助於幫助我們瞭解科學問題如何解決，比如蛋白質摺疊。

魔方是一個創建於1974年的三維拼圖遊戲，它的目標是對齊魔方同一面上所有相同顏色的方塊。

傳統的演算法可以解決謎題，但它們的計算能力和記憶體要求使得它們不適合像魔方這樣的謎題。這是因為它們通常不能透過隨機移動找出答案，而且很難從任何角度解出這個立方體。

核心演算法的通用性表明，它可能具有超越組合謎題的應用，因為在規劃、機器人和自然科學中，狀態空間大、目標狀態少的問題並不罕見。

這並不是人工智慧第一次展示“超能力”。

此前，一臺電腦在撲克比賽中擊敗了世界冠軍中的五名選手。這是第一次在複雜的戰略和計算遊戲中，計算機擊敗了不止一個對手。

1996年，計算機首次在國際象棋比賽中擊敗了人類世界冠軍，兩年前，在更為複雜的中國戰略遊戲圍棋中，更是如此。

但撲克帶來了更大的挑戰，因為它涉及到幾位玩家。與國際象棋或圍棋不同的是，計算機不能訪問所有可用的資訊，因為它看不到對手的牌。

這項研究發表在《自然機器智慧》雜誌上。

相關文章