比人類還聰明?這種AI靠自學就會玩魔方,百分百成功且只需20步

比人類還聰明?這種AI靠自學就會玩魔方,百分百成功且只需20步

人工智慧已經能在很多方面勝過人類,比如下圍棋、象棋、打撲克牌……近日,一種深度學習演算法已經被開發出來,它可以比任何人更快地解魔方。

它從來沒有失敗過,達到了100%的成功率,而且可以把步驟控制在約20步。

人類可以打破人工智慧18秒的紀錄,世界紀錄大約是4秒,但人類的效率要低得多,通常需要50步左右。

它是由加州大學歐文分校發明的。

這種新方法解決了計算機科學中的一個重要問題——如何使用這個名為DeepCube A的系統,在獲得的幫助最小的情況下解決複雜的問題。

在《自然機器智慧》(Nature Machine Intelligence)今天發表的一項研究中,研究人員證明,DeepCubeA能夠100%解決所有測試問題,並在大約60%的時間裡找到了通往目標狀態的最短路徑。

來自加利福尼亞大學的Pierre Baldi和他的同事們從之前的DeepCube專案中開發了DeepCubeA。

使用一種名為“自行迭代學習法”(autodidactic iteration)的新型深度學習技術,透過建立自己的獎勵體系來自學。

Baldi教授說:“人工智慧可以打敗世界上最好的人類象棋和圍棋選手,但一些更難的謎題,比如魔方,還沒有被電腦破解,所以我們認為這些領域對人工智慧的嘗試是開放的。”

“魔方的解決方案涉及到更多的符號、數學和抽象思維,因此能夠破解這樣一個謎題的深度學習機器,正越來越接近成為一個能夠思考、推理、計劃和決策的系統。”

給定一個未解的多維資料集,機器必須確定特定的移動是否是對現有狀況的改進。它透過結合強化學習和尋路的方法,在沒有人類幫助的情況下解決謎題。

與傳統演算法相比,DeepCubeA使用更少的記憶體,能夠在大多數情況下識別出謎題的最短路徑。

作者表示,它可以解決魔方、熄燈遊戲(Lights Out)、推箱子(Sokoban)和更大的問題,包括一個48片的滑動拼圖。

經過訓練後,網路使用一個標準的搜尋樹來搜尋每個狀況下的建議動作。

使用相同方法能解決的遊戲範圍很廣,這意味著它可以用於更大的問題,以找到接近最優解。解決含有大量組合的謎題,也有助於幫助我們瞭解科學問題如何解決,比如蛋白質摺疊。

魔方是一個創建於1974年的三維拼圖遊戲,它的目標是對齊魔方同一面上所有相同顏色的方塊。

傳統的演算法可以解決謎題,但它們的計算能力和記憶體要求使得它們不適合像魔方這樣的謎題。這是因為它們通常不能透過隨機移動找出答案,而且很難從任何角度解出這個立方體。

核心演算法的通用性表明,它可能具有超越組合謎題的應用,因為在規劃、機器人和自然科學中,狀態空間大、目標狀態少的問題並不罕見。

這並不是人工智慧第一次展示“超能力”。

此前,一臺電腦在撲克比賽中擊敗了世界冠軍中的五名選手。這是第一次在複雜的戰略和計算遊戲中,計算機擊敗了不止一個對手。

1996年,計算機首次在國際象棋比賽中擊敗了人類世界冠軍,兩年前,在更為複雜的中國戰略遊戲圍棋中,更是如此。

但撲克帶來了更大的挑戰,因為它涉及到幾位玩家。與國際象棋或圍棋不同的是,計算機不能訪問所有可用的資訊,因為它看不到對手的牌。

這項研究發表在《自然機器智慧》雜誌上。