這是一幅由谷歌公司2005年開源的 AI程序“DeepDream”創(chuàng)作出來的藝術(shù)作品。谷歌的另一項(xiàng)利用機(jī)器學(xué)習(xí)創(chuàng)作音樂、藝術(shù)作品的項(xiàng)目Project Magenta也發(fā)布了一個(gè)名為 NSynth (Neural Synthesizer)的神經(jīng)聲音合成器。
時(shí)間回溯到20世紀(jì)90年代中期的山景城加利福尼亞,當(dāng)時(shí)道格拉斯·艾克還是美國阿爾伯克基市的一個(gè)數(shù)據(jù)庫程序員,業(yè)余時(shí)間則兼職做個(gè)音樂人。在能源部的實(shí)驗(yàn)室里寫了一天的電腦代碼之后,他就會在當(dāng)?shù)氐囊粋€(gè)小酒吧里表演,演奏他所說的"朋克范兒的藍(lán)草音樂(藍(lán)草音樂,一種鄉(xiāng)村音樂)"--他管這叫做"Johnny Rotten遇上 Johnny Cash"(前者是英國朋克搖滾樂團(tuán)“性手槍”的主唱,后者是美國鄉(xiāng)村音樂創(chuàng)作歌手)。但他真正想做的是把自己的主業(yè)編程工作和業(yè)余的興趣愛好結(jié)合起來,利用機(jī)器來創(chuàng)造一種獨(dú)特的音樂。"將人工智能和音樂結(jié)合在一起是我畢生的唯一心愿",艾克說道。
這個(gè)想法雄心勃勃卻略顯稚嫩。那時(shí)道格拉斯·艾克就讀于離家不遠(yuǎn)的布盧明頓的印第安納大學(xué),他把這個(gè)想法拋給了認(rèn)知科學(xué)家道格拉斯·郝夫斯臺特(Douglas Hofstadter),其研究意識與機(jī)器間關(guān)系的著作《哥德爾、埃舍爾、巴赫:集異璧之大成》(G?del, Escher, Bach: an Eternal Golden Braid)還獲得了普利策獎(jiǎng)。卻不曾想郝夫斯臺特迎面給他澆了一盆冷水,堅(jiān)稱當(dāng)前即使是最先進(jìn)的人工智能技術(shù)也遠(yuǎn)遠(yuǎn)不夠成熟。但在接下來的二十年里,在科研一線工作的艾克孜孜不倦地堅(jiān)持著自己的想法,最終,人工智能發(fā)展水平趕上了他的野心。
去年春天,在 Google做了幾年的研究工作之后,艾克又重新拾起了多年前曾向郝夫斯臺特提起過的想法。這一想法付諸實(shí)踐后便有了Project Magenta的誕生。谷歌研究團(tuán)隊(duì)不僅讓這些開發(fā)出來的機(jī)器人學(xué)會了如何制作獨(dú)特的音樂,還能使它們創(chuàng)作出包括素描,視頻甚至笑話在內(nèi)的多重藝術(shù)形式。繼在智能手機(jī)、應(yīng)用軟件和互聯(lián)網(wǎng)服務(wù)等多項(xiàng)領(lǐng)域稱霸后,谷歌又在著手開發(fā)通信業(yè)務(wù),艾克則將Magenta視為這項(xiàng)業(yè)務(wù)自然而然的衍生物。
"這為人們創(chuàng)造了全新的溝通方式,"最近在谷歌人工智能研究總部接受的一次采訪中,艾克這樣說道。
該項(xiàng)目一方面也為利用人工智能技術(shù)創(chuàng)作藝術(shù)作品的實(shí)現(xiàn)作出了不懈努力,而人工智能也只是近些年來才趨向成熟的一門技術(shù)。所謂深度神經(jīng)網(wǎng)絡(luò)(deep neural network)就是利用分析大數(shù)據(jù)來學(xué)習(xí)特定的行為的一種復(fù)雜數(shù)學(xué)系統(tǒng)。例如,通過在數(shù)以百萬計(jì)的自行車照片尋找其共同的模型與款式,由此來學(xué)會如何識別自行車。這就是社交軟件Facebook識別在線照片中的面孔所應(yīng)用到的原理,安卓手機(jī)能夠識別口頭指令,以及微軟的通訊軟件Skype的翻譯功能同樣依賴于這項(xiàng)技術(shù)。不過這些復(fù)雜的系統(tǒng)同樣也可以創(chuàng)造藝術(shù)。例如,通過分析一組歌曲,它們可以學(xué)習(xí)如何制作類似的聲音。
正如艾克所說,要想使得機(jī)器能做制作出一首,或者夸張地說,乃至數(shù)萬億首的披頭士樂隊(duì)的新曲,而且每首聽起來既像是甲殼蟲樂隊(duì)自己錄制的音樂,又與其有些許差異,距離這個(gè)結(jié)果的達(dá)成仍要數(shù)年的時(shí)間,但至少這些系統(tǒng)已經(jīng)在向這個(gè)方向靠攏了。不過這種創(chuàng)作方式雖說創(chuàng)造出了藝術(shù),但最終從某種意義上來說又漸漸地瓦解了藝術(shù),這樣的結(jié)果并不是他所追求的。除了模仿之外,還有很多其他的創(chuàng)作途徑值得探索。人工智能最終的理念不是取代藝術(shù)家,而是為他們提供工具,讓他們以全新的方式去創(chuàng)造藝術(shù)。
二十世紀(jì)九十年代,艾克在新墨西哥州的小酒館里將Johnny Rotten and Johnny Cash的音樂糅合在了一起;現(xiàn)在,他正在構(gòu)建可以實(shí)現(xiàn)相似效果的軟件。利用神經(jīng)網(wǎng)絡(luò),他和他的團(tuán)隊(duì)把從各個(gè)樂器(比如像巴松管和古鋼琴的結(jié)合)中提取出的聲音混合在一起制造出人們聞所未聞的聲音。
另一幅利用“DeepDream”創(chuàng)作出的作品。“DeepDream”可以利用神經(jīng)網(wǎng)絡(luò)把一幅現(xiàn)成的照片生成為諸多的抽象圖片。
就如同通過分析上百張貓的照片來學(xué)習(xí)如何識別貓一樣,神經(jīng)網(wǎng)絡(luò)也可以通過分析數(shù)以百計(jì)的音符來學(xué)習(xí)巴松管的音樂特性,其可通過創(chuàng)建數(shù)學(xué)表達(dá)式,或者說一系列矢量以識別巴松管。由此,艾克和他的團(tuán)隊(duì)已經(jīng)將上百件樂器的發(fā)出的音符輸入了該神經(jīng)網(wǎng)絡(luò),為每一門樂器都建立一個(gè)特定的矢量。現(xiàn)在,只需在屏幕上動(dòng)動(dòng)按鈕,它們就可以結(jié)合部分矢量從而創(chuàng)造出全新的樂器:可能這門樂器發(fā)出的音色47%來自巴松管和53%來自古鋼琴,另一門樂器則是將這個(gè)比例顛倒了過來,以此類推。
幾個(gè)世紀(jì)以來,管弦樂的演奏都是不同樂器間樂音的相互交疊。但現(xiàn)在不同以往了,樂音不再是重疊交織的了。艾克和他的團(tuán)隊(duì)正在把幾種樂器的音色糅合在一起,為藝術(shù)家創(chuàng)造出前所未有的新的演奏方式。"我們正在制作下一代電影攝影機(jī),"艾克說。“還有新一代的電吉他。”
這個(gè)特殊項(xiàng)目,也就是所謂的 NSynth,目前還只是處于起步階段。但是,在藝術(shù)界和科技界中,許多人已經(jīng)開始對通過神經(jīng)網(wǎng)絡(luò)和其他人工智能技術(shù)來創(chuàng)造新藝術(shù)的做法躍躍欲試了。"這項(xiàng)技術(shù)在過去幾年中發(fā)生了突破性的進(jìn)展,"洛杉磯的攝影師兼藝術(shù)家亞當(dāng)·費(fèi)里斯如此評價(jià)道,“這是一項(xiàng)全新的美學(xué)形式”。
2015年,谷歌公司內(nèi)部的一支獨(dú)立研究團(tuán)隊(duì)開源了DeepDream,這套程序工具可以利用神經(jīng)網(wǎng)絡(luò),從現(xiàn)成的照片中生成出頗具迷幻效果而令人印象深刻的“夢境圖像”,而且目前對這項(xiàng)技術(shù)在創(chuàng)造新式藝術(shù)上的應(yīng)用已不僅僅限于谷歌一家公司了。如果該程序解析了一張關(guān)于狗的照片,并在圖中發(fā)現(xiàn)了一根形似眼球的狗毛,圖片效果就會著重強(qiáng)調(diào)這根狗毛并不斷重復(fù)這個(gè)過程,直至整只狗被旋轉(zhuǎn)的眼球圖案所覆蓋。
與此同時(shí),一些藝術(shù)家,如著名的多媒體表演藝術(shù)家特雷弗·帕格恩 (Trevor Paglen )或較為小眾的亞當(dāng)·費(fèi)里斯正在以其它方式來探索神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式。1月份的時(shí)候,帕格恩在舊金山一間陳舊的海運(yùn)倉庫進(jìn)行了一次表演,借用神經(jīng)網(wǎng)絡(luò)可以追蹤人類觀察方式和移動(dòng)路徑的特性,對計(jì)算機(jī)視覺的倫理性進(jìn)行了探索。例如,當(dāng)先鋒樂團(tuán)克洛諾斯四重奏樂團(tuán)(Kronos Quartet)的成員在臺上演奏時(shí),神經(jīng)網(wǎng)絡(luò)能夠?qū)崟r(shí)分析他們的表情,猜測他們的情緒。
態(tài)度之于工具,就像老瓶裝了新酒。曾制作詩歌生成軟件的紐約大學(xué)教授艾莉森·帕里什(Allison Parrish)指出,藝術(shù)家們早在自二十世紀(jì)五十年代開始就已經(jīng)在使用計(jì)算機(jī)進(jìn)行創(chuàng)作了。她說:“正如杰克遜.波洛克(ackson Pollock)所想到的一種新的繪畫手法一樣,他所做的就是打開顏料罐,把顏料肆意揮灑在帆布上。”這些新的計(jì)算機(jī)技術(shù)為藝術(shù)家們創(chuàng)造了一塊色調(diào)更豐富的調(diào)色板。
一年前,戴維·哈(David Ha)還是東京高盛集團(tuán)下的一名交易員。一到午休時(shí)間,他就開始把玩神經(jīng)網(wǎng)絡(luò),并將制作出來的結(jié)果放在自己化名下的博客上。此外,他還建立了一個(gè)可以自行寫下日文漢字的神經(jīng)網(wǎng)絡(luò),這種日文漢字與其說是寫出來的,倒更像是畫出來的圖案。
不久后,艾克和谷歌公司的其他成員發(fā)現(xiàn)了該博客,現(xiàn)在哈正在谷歌公司著手研究Magenta項(xiàng)目。利用名為 SketchRNN的項(xiàng)目,他正在構(gòu)建可以繪制圖案的神經(jīng)網(wǎng)絡(luò)。通過分析幾千張普通人繪制的電子版速寫畫,這些神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)繪制像豬、卡車、小船或瑜伽姿勢之類的圖像。不過他們不抄襲別人畫過的東西,他們有自己的畫法,會選擇從數(shù)學(xué)的角度來辨別豬的形態(tài)。
比方說,你可以要求它們畫一只安上貓頭的豬,或從缺了一只馬蹄的馬匹,又或者畫出一輛形似小狗的卡車,用任意幾條彎曲線條造出一艘小船。就像對待NSynth或 DeepDream一樣,藝術(shù)家們不大可能會用這些新工具來創(chuàng)作藝術(shù)作品,但是,如果你一旦嘗試了這種技術(shù),你就會發(fā)現(xiàn)他們是是由哈創(chuàng)造出來的自成一派的鮮活作品。人工智能不只是創(chuàng)造新的藝術(shù)派別,它正在創(chuàng)造新型的藝術(shù)家。(付文韜 翻譯自紐約時(shí)報(bào))