深度學習如何像人類一樣產生“創造力”,一直是AI科學家們研究的熱點。羅格斯大學和查爾斯頓學院近日聯合發布了一篇論文,發布了一種全新的深度學習模型——創意對抗網絡(Creative Adversarial Networks,CANs)。CAN通過學習風格和偏離風格規范來生成“藝術作品”。該論文是在2017年6月20日至6月22日在亞特蘭大舉行的第八屆國際計算創意大會(ICCC)發布的論文的擴展版本。
我們提出了一個新的藝術創作系統。該系統通過觀察藝術并學習風格來生成藝術作品,并通過偏離學習的風格增加生成的藝術的喚醒潛力而變得創造性。我們建立了生成對抗網絡(GAN),它已經顯示出學習生成模擬給定分布的新穎圖像的能力。我們認為,這樣的網絡在其原始設計中產生創意產品的能力有限。我們提出對其目標的修改,使其能夠通過最大限度地偏離已建立的風格和最小化偏離藝術品分布來創造創意藝術。我們進行實驗,比較人類測試者對所產生的藝術的反應,以及他們對藝術家創造的藝術的反應。結果表明,人類測試者無法將系統生成的藝術作品與當代藝術家所產生的藝術區分開。人類測試者甚至在某些程度上,對機器生成的圖像產生了更高的評價。
自從人工智能崛起以來,科學家一直在探索機器產生詩歌、故事、笑話、音樂、繪畫等人類創意產品的能力,以及對于創造能力的解決方案。這種能力才是真正顯示人工智能算法是否智能的基礎。在視覺藝術方面,已經提出了幾種系統,不僅在AI和計算創意領域,而且在計算機圖形學和機器學習中,自動創建藝術的算法亦有研究。
在有關計算創意的相關文獻中,提出了不同的算法,專注于發現各種有效的探索創意空間的方法。幾種方法已經使用進化過程,其中算法通過生成候選者進行迭代,使用適應度函數來評估它們,然后修改它們以改善下一次迭代的適應度分數。通常,該過程在遺傳算法框架內完成。正如DiPaola和Gabora 2009所指出的,任何算法的挑戰都集中于“如何編寫具有審美意義的邏輯適應度函數”。一些早期的系統在回路中使用了一個能夠引導進程的人類。在這些互動系統中,計算機探索創意空間,人類扮演觀察器的角色,其反饋對于推動過程至關重要。而最近的系統則強調了創意過程中感知和認知的作用。
本論文的目的是發現藝術生成的計算創意系統,而不需要在創作過程中涉及到人類藝術家,但仍然將人類創意產品融入到學習過程中。藝術生成算法的一個重要組成部分是將他們的創作過程與人類藝術家在時間上產生的藝術相關聯。我們相信這是重要的,因為人類的創作過程利用了藝術的先前的經驗。一位人類藝術家不斷接受其他藝術家的作品,并且一直以來都面對著各種各樣的藝術。人類藝術家如何將過去藝術的知識與他們產生新形式的能力結合在一起仍然在很大程度上是未知的,這需要一套理論來建模,如何將藝術風格與藝術創作相結合。
科林·馬丁代爾(Colin Martindale,1943-2008)提出了一種解釋新藝術創作的心理學理論。他假設,在任何時候,創意藝術家都試圖增加藝術的喚醒潛力來推動改變慣性。然而,這種增長必須是最小的,以避免觀察器的負面反應(最不努力的原則)。馬丁代爾還假設,當藝術家在風格的角色中發揮其他手段時,風格的突破就是增加藝術的喚醒潛力的一種方式。本文提出的方法靈感來自于馬丁代爾的最小努力原則和他對風格的分析。在試圖解釋藝術進步的理論中,我們發現馬丁代爾的理論是在計算上可行的。
深層神經網絡最近在推動各種應用領域的人工智能方面發揮了轉型作用。特別需要指出的是,人類已經提出了幾個具有生成新穎圖像以模擬給定訓練分布的生成深層網絡。生成對抗網絡(GAN)已經非常成功地實現了這一目標。我們認為,這樣的網絡在其原始設計中產生創意作品的能力有限。靈感來自于馬丁代爾的理論,在本文中,我們提出修改GAN的目標,使其能夠通過最大化偏離已建立的風格同時最大限度地減少偏離藝術品分布來創造創意藝術。
生成的圖像的樣本
在提出的創意對抗網絡(CAN)中,發生器被設計為接收來自鑒別器的兩個信號,作為兩個相互矛盾的力量,以實現三點:
1)生成新作品;
2)新作品不應該太新,它不應該遠離分布,否則會產生太多的喚醒,從而根據Wundt曲線激活厭惡系統并落入負面特征范圍;
3)生成的作品應該增加風格的模糊性。
類似于生成對抗網絡(GAN),CAN具有兩個對手網絡,一個鑒別器和一個發生器。鑒別器可以使用與風格標簽(文藝復興、巴洛克風格、印象派、表現主義等)相關的大量藝術品,并使用它來學習區分風格。生成器無法訪問任何藝術品,它從隨機輸入中生成藝術,但與GAN不同,它從鑒別器接收兩個信號,以生成其任何作品。
第一個信號是鑒別器對“藝術與非藝術”的分類。在傳統的GAN中,該信號使得發生器能夠改變其權重,以產生更頻繁地欺騙鑒別器關于它是否來自相同分布的圖像。由于我們案例中的鑒別器是對藝術進行了訓練的,所以這將表明鑒別器是否認為所產生的藝術來自與知道的實際藝術相同的分布。在這個意義上,這個信號標示出鑒別器是否認為呈現給它的圖像是“藝術還是非藝術”。由于發生器僅接收到該信號,所以它將最終收斂以產生將模擬藝術的圖像。
發生器接收的第二個信號是關于鑒別器可以將生成的藝術分類成已建立樣式的信號。如果發生器生成了鑒別器認為是藝術的圖像,并且也可以容易地分類成已建立的樣式之一,則發生器將愚弄鑒別器以相信它產生符合已建立樣式的實際藝術。相比之下,創意發生器將嘗試產生混淆鑒別器的藝術。一方面,它試圖欺騙鑒別器認為它是“藝術”,另一方面它試圖混淆鑒別器所產生的作品風格。
這兩個信號是矛盾的力量,因為第一個信號推動發生器產生鑒別器接受為“藝術”的作品,但是如果它在已建立的樣式的規則中成功,則鑒別器也將能夠對其風格進行分類。 那么第二個信號將會對發生器造成嚴重的懲罰。 這是因為第二個信號推動發生器產生風格模糊的作品。 因此,這兩個信號在一起應該推動發生器探索靠近藝術分布的創意空間。