王略:我想用AI重塑攝影史經(jīng)典作品 | 正午視覺

我以喂圖+語言指令+參數(shù)的形式嘗試生成,仿制了攝影史上有共識性的?30?張照片。

2025年01月17日北京來源:界面新聞

正午

采訪|李響

 

過去一兩年,AI生成圖像技術(shù)迅速成熟,并滲透到社會生活的方方面面。像傳統(tǒng)攝影一樣,它也有專業(yè)技術(shù)門檻嗎?它會不會取代傳統(tǒng)攝影本身,甚至模糊真實和虛構(gòu)的界限?這是很多業(yè)內(nèi)人士和普通人關(guān)心的問題。

作為一名在媒體工作20余年的圖片編輯,我經(jīng)歷了從膠片到數(shù)碼的技術(shù)轉(zhuǎn)換,如今又遇到AI生成影像的新浪潮。這項技術(shù)的確成倍提高了操作和使用的便捷性,但是在大量生成AI配圖的過程中,我也產(chǎn)生了某種抵觸情緒。隨著海量重復(fù)畫面的誕生,影像已經(jīng)變得毫無生趣。

帶著復(fù)雜的感受,我采訪了王略。他是高校從事攝影教學(xué)的一位教師,近兩年他對AI影像生成進(jìn)行了積極的探索。在他的最新作品《虛構(gòu)的攝影史》中,他試圖探討AI生圖與傳統(tǒng)攝影的邊界與可能。以下是我們的對談。

 

正午:在過去多年的創(chuàng)作中,你有哪些和技術(shù)相關(guān)的作品嗎?

王略:我工作的學(xué)校是理工科背景,我個人一直關(guān)注技術(shù)的新動向。2010年,我拍過一組叫《星圖》的作品,就是討論科技與藝術(shù)的關(guān)系。我拍的是電腦主板,拆了幾十臺主機(jī),里面的主板顏色、排線各有不同,工程師在設(shè)計之初都是以功能為前提設(shè)計的,但卻自然的形成了美感。問過專業(yè)人士我才知道,不同染料的電阻系數(shù)不同。主板是現(xiàn)代工業(yè)的一個縮影,在嚴(yán)密的理性設(shè)計后,它卻有著藝術(shù)品一樣的動人呈現(xiàn)和秩序美感。

 

正午:你為什么想將AI技術(shù)融入到個人創(chuàng)作呢?

王略:我較早就接觸到AI 的使用。最初嘗試用 AI 生成圖像時,內(nèi)心的真實感受是,攝影要完蛋了,一切與攝影相關(guān)的內(nèi)容都要瓦解了。原因就是, AI 生成圖像的真實感直逼攝影。對于沒有經(jīng)驗的眼睛, AI 可以生成以假亂真的圖像。攝影的一切美學(xué)基礎(chǔ)來源于從現(xiàn)實世界鎖取光影形成的真實感,而 AI技術(shù)正是撼動了這種真實感。攝影術(shù)從發(fā)明到現(xiàn)在不足兩百年,很多作品的文獻(xiàn)價值比藝術(shù)價值大得多,可以說是人類的記憶。AI 技術(shù)可以輕松模擬這種記憶,甚至篡改記憶,讓人們不再相信攝影的真實性,進(jìn)而徹底消解掉攝影對于人類的價值。攝影的使命也就完結(jié)了。在這種感受下,我開始著手制作《虛構(gòu)的攝影史》,想把這個迫在眉睫的問題提出來討論。

 

正午:你使用什么工具?

王略:我主要使用 midjourney(MJ),通過一個聊天空間,和機(jī)器人對話,生成的圖片大家能時時看到,也可以下載。我先找到能夠代表攝影發(fā)展進(jìn)程中有共識性的照片,以喂圖+語言指令+參數(shù)的形式嘗試生成,大概兩三個月的時間,仿制了將近 30 張著名的歷史照片。

 

正午:在創(chuàng)作的過程中,有讓你印象深刻的細(xì)節(jié)么? 

王略:印象比較深刻的是蘭格的《移居的母親》,原作拍攝于1930 年代經(jīng)濟(jì)大蕭條時期的美國?部。當(dāng)時生成的人物的情緒、動勢、畫面的氣氛都很接近原作,但卻多出來一個孩子,原作是母親在中央,兩邊各一個孩子趴在肩膀上,而生成的圖像里有三個孩子,我百思不得其解。后來我無意間發(fā)現(xiàn),原作母親的懷里的確還抱著一個嬰兒,裹在襁褓里,露出了極少的側(cè)臉,不仔細(xì)看很難發(fā)現(xiàn)。而AI生成的第三個孩子就是這個,這是 AI 給我的又一次震撼,它的讀圖能力超出了一個??的人類。對于以圖生圖的形式, 必須是先了解圖中的內(nèi)容才能復(fù)制,AI識別到了人眼睛遺漏的部份。

左圖:《移居的母親》原作。右圖:AI技術(shù)以圖生圖仿制圖,發(fā)現(xiàn)了第三個孩子。

 

正午:你覺得AI擅長的是什么?在哪方面比較笨拙?

王略:應(yīng)該是得益于大數(shù)據(jù)的積累,AI對于做出一張生動有感染力的肖像照片很在行,但是對于人物的肢體,尤其手的描繪,出錯是常事。不是關(guān)節(jié)處安置?度有問題,就是手或手指的數(shù)量出問題,根源應(yīng)該也在于數(shù)據(jù)量與算力的不足。手是人體當(dāng)中最復(fù)雜、也是人最熟悉的部位,畫過手的人更能體會——五個手指的活動軌跡、透視?度可以有無數(shù)種組合,但只要出一點錯看著就別扭。在遠(yuǎn)景、大場面的人物生成上,AI 似乎放棄了人物的細(xì)節(jié),臉部五官位置挪移、不清晰是很正常的事情。在仿制?功吾《越戰(zhàn)中的女孩》時,遠(yuǎn)方士兵看著比前面人物高大很多,顯然違反了基本的透視關(guān)系,所以,后來我很容易從一些細(xì)節(jié)處發(fā)現(xiàn)畫面是否是AI生成的。

左圖:黃功吾《越戰(zhàn)中的女孩》。右圖:AI技術(shù)以圖生圖。

 

正午:在進(jìn)行AI生成圖像的過程中,你覺得有跟傳統(tǒng)攝影接近的某些感受么?

王略:在制作過程中,一般要等待幾十秒到幾分鐘的時間,圖像才能完全顯現(xiàn)出來,這跟網(wǎng)速與生成內(nèi)容的多少有關(guān),但都會經(jīng)歷三個階段:一開始畫面只是一團(tuán)模糊的噪點; 然后是大概輪廓顯現(xiàn)、畫面慢慢成型;最后逐步清晰、成圖生成完成。在這個過程中,我覺得,自己的心理狀態(tài)很象在暗房里,把已經(jīng)曝好光的相紙侵入到顯影液,在微弱的紅光下期盼理想效果的顯現(xiàn)。對于期盼度高的作品,內(nèi)心有強(qiáng)烈的焦灼感與賭心。如果只是一般的作品,就會利用這個時間上個廁所或沖杯咖啡,放松一下。

左圖:仿制南·戈爾丁作品的進(jìn)程中效果圖。右圖:成像效果。

 

正午:這個比喻很妙,都是等待“顯影”的過程。你遇到過AI無法生成圖的情況么?

王略:我發(fā)現(xiàn),在輸入文字的過程中,當(dāng)提示詞中有“no clothes”、“ nude“這類的詞語時,系統(tǒng)通常會給予提示警告,也根本不會繼續(xù)生成。但在以圖生圖?斯頓的女人體時,反而沒有出現(xiàn)這樣的提示。

左圖:愛德華·韋斯頓《女人體》原作。右圖:AI技術(shù)以圖生圖。

 

正午:你覺得AI有它自己的偏好么?

王略:我發(fā)現(xiàn) AI 時常會有意識的回避原圖的畫面結(jié)構(gòu),比如原圖主體面朝左側(cè),而生圖正好相反;原圖是中景,仿制圖可能就變成近景。以AI的復(fù)制能力,生成一張一樣畫面結(jié)構(gòu)的新圖更加容易,但卻刻意的改變,似乎有意在規(guī)避版權(quán)問題。比如在仿制美國當(dāng)代攝影師埃里克·索斯《I Know How Furiously Your Heart Is Beating》作品集中的一張女性肖像作品時,雖然生成的畫面色調(diào)與氣氛與原作非常吻合,但四張小圖有兩張人物在畫面中的方向與原作完全相反,另外兩張方向一致的畫面,人物躺的?度也不一致,人物在畫面中的取景范圍也被縮小了,變成了更近的景別。 

左圖:埃里克·索斯原作。右圖:AI技術(shù)仿制圖。

 

正午:在我的經(jīng)驗中,可能是由于數(shù)據(jù)采集的局限性,MJ在理解一些中國的情景時很困難,你覺得呢? 

王略:這個未必。在制作《虛構(gòu)的攝影史》之前,我做過一個有趣的實驗,把中國的古詩詞作為指令提示詞輸入來生成圖像。比如王維《山居秋明》中的兩句,“竹喧歸浣女,蓮動下漁舟”,需要先在 Google 翻譯里譯成英文“Bamboos rustle with the return of washerwomen, lotus leaves sway as fishing boats descend”,然后直接輸入生圖,結(jié)果效果十分驚人。沒有想到 AI 對中國詩詞里表達(dá)的意境把握的非常到位,與想象的畫面貼合度很高。無論畫面的構(gòu)圖、色調(diào),以及人物的服飾、動勢、神情,都帶有濃郁的中式審美?格,畫面中透露出的悠然、飄逸之感更是獨屬中國的味道。我并沒有對人物的著裝、動勢做任何具體的語言指令調(diào)整,AI 卻能夠以文字意境自動揣摩出貼合度很高的場景與具體細(xì)節(jié)。

“竹喧歸浣女,蓮動下漁舟”AI生圖。

 

正午:在創(chuàng)作完成之后,你覺得跟人類攝影師比,AI整體有哪些方面的不足?

王略:在操作逐步熟練的過程中,我發(fā)現(xiàn)AI 在想象力層面有隨機(jī)性,完全同樣的提示指令,今天生成的與明天生成的都不一樣。比較來看,人類個體的想象力相對穩(wěn)定,你從事哪方面工作,對哪方面感興趣,更關(guān)注哪方面,自然腦海中搜集的信息就越多,這方面可創(chuàng)造出的東?就越多。我因此也重新發(fā)現(xiàn)攝影的意義,推翻了最初的判斷。從現(xiàn)實中抓取的細(xì)節(jié)和質(zhì)感,始終還是攝影最打動人的地方,哪怕構(gòu)圖再差,攝影還是能透露出光與空間的氣質(zhì)。

 

正午:你認(rèn)為 AI 技術(shù)的使用,可能會對哪些行業(yè)沖擊最大?

王略:最初我的感覺是 AI 影像的出現(xiàn),對婚紗、影樓、寫真攝影的沖擊可能是毀滅性的,因為單純從經(jīng)濟(jì)和便捷性來講,拍攝一套寫真耗費的時間、金錢成本顯然比用 AI 技術(shù)換頭換身體大得多。但現(xiàn)在看,這個判斷忽略了另一個重要的層面,就是拍攝行為本身的意義并不等同于一張結(jié)果性的照片,被攝對象需要的是對“我”的確立,這是要通過“出鏡”來實現(xiàn)的。不論后期怎么美化,拍的還是“我”。而且寫真攝影作為一個行業(yè),是一個服務(wù)與享受服務(wù)的過程,從定妝、化妝到現(xiàn)場調(diào)動、拍攝,對被攝者是一個整體的體驗與享受的過程,這些都不是一組換臉照片可以取代的。 所以,十幾年前數(shù)碼相機(jī)的出現(xiàn),也并沒影響到大畫幅攝影創(chuàng)作者的數(shù)量,更沒有妨礙他們不辭辛苦背著幾十斤重的設(shè)備與膠片翻山越嶺去創(chuàng)作,因為“玩”的內(nèi)容不一樣。AI 影像技術(shù)與攝影終究還是兩回事, 在商業(yè)上 AI 可以快速解決產(chǎn)品類的“造像”需求,但與人體驗相關(guān)的,尤其在藝術(shù)創(chuàng)作層面,AI 與攝影還是只能各干各的事兒。

 

正午:你怎么看待人工智能跟人類的關(guān)系?

王略:AI技術(shù)的確高效,在商業(yè)上可以取代大量的人工,但對于技術(shù)的終端使用者,卻是被動的,甚至是悲哀的。大部分人類群體都象牛?一樣被驅(qū)使著前行,技術(shù)對于掌權(quán)者帶來的是生產(chǎn)力,但對于大部分底層人們帶來的更多是恐慌。工作被剝奪只是一個層面,當(dāng)大部分人類感覺到自己處處不如 AI 時,會懷疑自身存在的意義。

OpenAI 開始擴(kuò)張時,曾經(jīng)對外傳達(dá)過 AI 創(chuàng)造出的財富可以反哺給人類的觀念。但這恰恰忽略了人創(chuàng)造價值、實現(xiàn)自我的精神需要。沒有了這點,就沒有了方向與活著的動力,更沒有了延續(xù)生命的欲望。

 

以下是王略的作品《虛構(gòu)的攝影史》中部分作品和原作的對照:

窗外的風(fēng)景(虛擬作品)
尼埃普斯原作:窗外的風(fēng)景

 

兩種人生(虛擬作品)
雷蘭德原作:兩種人生

 

德國人(虛擬作品)
奧古斯都·桑德原作:德國人

 

 登陸硫磺島(虛擬作品)
喬·羅森塔爾原作: 登陸硫磺島

 

 勝利之吻(虛擬作品)
弗雷德·艾森施泰特原作: 勝利之吻

 

原子的達(dá)利(虛擬作品)
哈爾斯曼原作:原子的達(dá)利

 

男孩 (虛擬作品)
布列松原作:男孩

 

瑪麗蓮·夢露(虛擬作品)
山姆·肖原作:瑪麗蓮·夢露

 

雙胞胎(虛擬作品)
戴安·阿博斯原作:雙胞胎

 

切·格瓦拉(虛擬作品)
阿爾貝·托科爾達(dá)原作:切·格瓦拉

 

水塔系列(虛擬作品)
貝歇夫婦原作:水塔系列

 

玩具自行車(虛擬作品)
威廉·埃格爾斯頓原作:玩具自行車

 

 

——完——

本文作者李響,界面新聞圖片總監(jiān)。

本文圖片由受訪者提供。

表情
您至少需輸入5個字

評論(0