人工智慧，如何妙筆“生”畫

核心閱讀

輸入一段話，“繪”出一幅畫——人工智慧的繪畫本領，吸引眾多職業畫師和零基礎使用者嚐鮮。人工智慧繪畫的本質是計算，接受“語言描述”指令後根據自身的理解還原出影象。未來，人工智慧技術應用於藝術創作等領域，還要注意防範潛在風險，讓技術進步更好地造福社會。

不用畫筆、顏料，輸入一段描述性文字，計算機就能自動解析，生成相應的畫作。2022世界人工智慧大會上，人工智慧繪畫的展示令觀眾驚歎。

一些過去專屬於人類創作的領域，比如繪畫、書法、寫作、作曲，如今人工智慧也已開始涉足。人工智慧是如何繪畫的？當前沿技術與藝術相遇，將碰撞出怎樣的火花？在內容、版權等方面又是否存在問題？

從文字到影象，人工智慧繪畫本質是計算

人工智慧繪畫是一個從文字到影象的生成過程，輸入一段話，生成一幅畫，本質是計算。簡要地說，計算機透過大量學習，能識別特定圖片元素和文字之間的關聯。同理，人工智慧程式在收到“語言描述”指令後，可以根據自身的演算法還原出影象。

設定計算機程式作畫的想法由來已久。早在20世紀70年代，就有藝術家開發了操作機械臂的電腦程式，讓機械臂按照指令在畫紙上作畫。近些年，人工智慧技術日新月異，科研人員嘗試設計自動作圖的計算機程式。但過去很長一段時間，人工智慧“畫”出的作品普遍不夠好，往往只是一些模糊的影象元素的組合，還稱不上是完整的畫。

今年以來，人工智慧畫技迅速“進化”。談及技術突破原因，百度文心一格總架構師肖欣延認為，這是預訓練大模型的興起、大資料的訓練和擴散模型的出現3方面共同作用的結果。

具體來說，預訓練大模型增強了人工智慧的通用性，成為人工智慧技術及應用的新基座；大資料的訓練中，透過在眾多高效能GPU（圖形處理器）算力資源中進行並行學習，計算機能夠在短時間內完成大量的資料學習。近年來，幾乎所有人工智慧的技術發展都受益於這兩方面的進展。而對人工智慧繪畫來說，擴散模型的出現至關重要。

擴散模型的原理是，透過人為逐步新增噪聲，讓影象逐漸變“模糊”，再不斷學習去噪過程，如此人工智慧就能從完全是噪聲的圖片中逐漸還原出清晰的圖片，即“畫”出影象。

“這一過程與人類學習相似。通常，人們學畫從臨摹開始，機器也是如此。它最初生成的影象可能很模糊，但計算機會不斷修正，從而輸出越來越清楚、層次越來越豐富的影象。”肖欣延說。

擴散模型讓人工智慧繪畫技術實現跨越，不僅作畫質量快速提升，生成時間也縮短到幾秒鐘。

眾多使用者嚐鮮，大量應用加速“畫技”進化

湯林傑是某網際網路公司的運營人員。工作中，他需要藉助一些圖片來豐富文案，而網路上找到合適的配圖並不容易。今年10月，瞭解人工智慧繪畫程式後，他嘗試自己“畫”圖。現在，人工智慧繪畫工具已經是他工作的重要輔助。

隨著演算法模型對公眾開放以及訓練資料成本的下降，人工智慧繪畫門檻越來越低，一些簡易化操作平臺在國內外興起。如今，不僅一些職業插畫師嘗試用人工智慧繪畫程式輔助作畫、激發靈感，許多沒有繪畫基礎的使用者也開始嚐鮮，並“曬”在社交平臺上。

大量需求的湧現也加速了技術的更新迭代。“用人工智慧繪畫的人越多，演算法就越能理解輸入的描述文字，畫作質量就越高。”肖欣延表示，當前人工智慧繪畫水平與今年初相比，已經有很大進步。

不過，目前的人工智慧繪畫技術並不完美。首先，可控性仍然不高，即計算機不能很好理解人類指令的含義，即便是輸入“畫兩個蘋果，左邊紅色，右邊綠色”這樣的簡單描述，生成的影象也可能有很大偏差；其次，細節呈現能力還不夠。比如，對空間、透視和光影的刻畫就很不如意。不少人工智慧渲染出的畫作，初看上去驚豔，認真觀察問題卻不少。

但肖欣延認為，人工智慧繪畫在技法上的缺陷未來有望得到彌補。比如，基於跨模態大模型和強大的深度學習框架，百度開發的技術一定程度上已經緩解這些問題。此外，未來人工智慧不僅能作畫，還能根據文字描述生成影片，並直接配上解說文字，“可以把影片生成看作是維度更高的繪畫，從技術層面看，這是可以實現的。”

防範潛在風險，守住法律和倫理底線

人工智慧進入繪畫領域，計算機會取代人類畫師嗎？

在肖欣延看來，好的繪畫與構圖、設計語言、視覺情緒息息相關，即使人人都可以用人工智慧技術作畫，但通常只有高水平的畫師才能製作出優秀的人工智慧繪畫作品，“人工智慧只是作畫的輔助工具”。此外，雖然有的人工智慧繪畫語言嫻熟，也包含細膩的情感，但並不意味著機器有意識、情感，它不過是學過類似的作品，又恰好呈現出來了。“優秀的藝術作品往往是人的思想的投射，目前機器並沒有真正具備思考能力。”肖欣延說。

不少業內人士認為，不妨以開放的心態擁抱人工智慧繪畫，接受新事物。可以預想，將來繪畫中一些繁瑣、重複性的工作可能由計算機完成，創作者能騰出更多時間去構思想法與創意，調整構圖、色彩、光影氛圍等。

“人工智慧可能會激發繪畫創造的活力。”肖欣延表示，20世紀前後，照相技術讓傳統肖像畫失去市場，促使一些畫家向非寫實方向創新。與人工智慧技術融合，或許能激發畫家創作出別開生面的作品。

不只是繪畫，寫作、作曲、生成短片，人工智慧日益強大的深度學習能力，讓它與不同藝術門類發生著奇妙的碰撞。展望未來，業界專家認為，人工智慧與藝術融合，一方面會降低一些藝術門類的創造門檻，讓更多人參與到當代的審美創造中來；另一方面新技術會帶來新的審美風格，人們或許能從中擴充套件對自身和世界的認識。

本報記者喻思南

人工智慧，如何妙筆“生”畫

相關文章