正在閱讀:

龍年春節(jié),AIGC帶來哪些“新年俗”?

掃一掃下載界面新聞APP

龍年春節(jié),AIGC帶來哪些“新年俗”?

人工智能正在擁抱生活的每一個(gè)角落。

圖片來源:界面新聞 匡達(dá)

文|娛樂資本論 James

馬上就過年啦!你家里過年有什么習(xí)俗呢?

原先,是聚在一起放鞭炮,吃一頓團(tuán)圓飯,不論主食是餃子還是米飯。八九十年代,電視機(jī)里看春晚成了一條新增的民俗。接下來,移動(dòng)互聯(lián)網(wǎng)的興起,又讓電子紅包替代了“實(shí)體紅包”和紙幣。

要說過去的一年有什么新技術(shù)最火爆,那肯定是AIGC了。面對(duì)大模型如雨后春筍般出現(xiàn),文生圖工具解放了普通人作畫的門檻,越來越多的自動(dòng)回復(fù)開始變得更智能……我們很好奇。AIGC會(huì)給2024年的春節(jié)帶來怎樣的新民俗呢?

01 百度:三款主要產(chǎn)品批量上新

首先,我們得一起來梳理一下“大廠”們交的答卷。

百度旗下三款主流應(yīng)用——百度APP、文心一言和百度網(wǎng)盤,都在春節(jié)期間批量上新。

文心一言可以生成數(shù)字分身,使用照片、人聲并指定性格,可以輸出一個(gè)對(duì)話模型,并使用你的音色回答問題。

它的性格設(shè)定用了MBTI的概念,說不準(zhǔn)可以看到另一個(gè)次元壁上的自己是啥樣。遺憾的是,照片只不過是用作頭像,如果要做數(shù)字人拜年視頻的話還是不行的。

另外,如果單論輸出音色,其實(shí)剪映目前也在內(nèi)測生成音色功能,據(jù)說很快就要全量上線。這樣,你就不用在孫悟空和派大星那些里面選來選去了。   

在百度APP可以使用寫祝福、畫頭像、畫龍、拍寫真這些功能,祝福語也可以寫藏頭詩。

百度網(wǎng)盤的云一朵智能助手,將其中的星座運(yùn)勢功能稍加改動(dòng)變成了生肖運(yùn)勢預(yù)測,你覺得他說的靈驗(yàn)嗎?

02 阿里:全民舞王再顯神通  

阿里的通義千問,年初以“全民舞王”這個(gè)小游戲走紅,娛樂資本論·視智未來也對(duì)其背后的技術(shù)研發(fā)團(tuán)隊(duì)做了個(gè)詳盡的專訪。

在過年期間,通義千問將全民舞王、通義萬相、通義照相館三個(gè)特別功能都做了春節(jié)特別安排。

“通義萬相”是經(jīng)典的作圖工具,新增的“萬物成龍”功能讓萌寵、風(fēng)景、靜物等圖片都可以生成類似風(fēng)格的龍,我們?cè)嚵嗽囕斎牒与嗑?nbsp;  

 

 

新春版全民舞王新增了幾個(gè)能添加舞伴的動(dòng)作模板,正如他們預(yù)告的那樣,“今年計(jì)劃加入的新功能,至少包括多人共舞和上傳半身照片”,當(dāng)然這么快就出來也是讓人沒想到的。

至于“通義照相館”,可以在同一張照片當(dāng)中,引入最多5名不同的家庭成員,用自己5張正面照片所制作的數(shù)字影像模型(LoRA)合影。

他們預(yù)設(shè)的模板涵蓋了一些影樓常見的全家福照片的風(fēng)格。我試了一下,效果還不錯(cuò),至少能看出是我的臉。

目前在阿里的各個(gè)部門中,對(duì)AI技術(shù)的應(yīng)用,似乎是在進(jìn)行“賽馬機(jī)制”。眾所周知的妙鴨相機(jī),跟通義照相館也是采取獨(dú)立發(fā)展的路線。而在支付寶APP當(dāng)中,也有另一個(gè)不太起眼的AI應(yīng)用。

支付寶“集五?!币呀?jīng)接近尾聲,有一種途徑,是在畫面當(dāng)中“找不同”的方式來找福字。他們使用ControlNet類似的方式將福字嵌入到AI文生圖當(dāng)中,每個(gè)圖當(dāng)中會(huì)有1~2個(gè)福字,很容易發(fā)現(xiàn)并且用手點(diǎn)出來。據(jù)說功能上線也就一兩天時(shí)間,已經(jīng)生成了10萬多張帶有福字的圖片。   

03 智譜:收編網(wǎng)紅“家族群模擬器”  

在大廠之外,有多個(gè)個(gè)人和機(jī)構(gòu)開發(fā)者都瞄準(zhǔn)了大語言模型能進(jìn)行情景模擬的優(yōu)點(diǎn)。過去一個(gè)月當(dāng)中,已經(jīng)有多款模擬器類產(chǎn)品出現(xiàn),直接針對(duì)過年場景的更是不少。

有清華血統(tǒng)的智譜清言一口氣推出了好幾個(gè)模擬器,其中包括“七大姑八大姨模擬器”,還有為家庭聚會(huì)準(zhǔn)備游戲,或者是如何表現(xiàn)高情商等等。   

當(dāng)然這些選單點(diǎn)擊過去之后,也有一定概率會(huì)發(fā)現(xiàn),它生成的答案并非那么特異性。不過我們要重點(diǎn)講講模擬七大姑八大姨的模擬器,它背后還有一個(gè)小插曲。

與僅僅使用prompt調(diào)節(jié)的場景模擬相比,由Chatmind AI開發(fā)的一個(gè)家族群模擬器《決戰(zhàn)拜年之巔》就進(jìn)行了更周到細(xì)致的,全方位的模擬,其效果也更逼真一點(diǎn)。Chatmind是獨(dú)立團(tuán)隊(duì)開發(fā)的大模型驅(qū)動(dòng)的思維導(dǎo)圖產(chǎn)品,之前使用的基底大模型是GPT-4。   

在前兩天被媒體廣泛報(bào)道之后,該模擬器經(jīng)過多次擴(kuò)容,仍然無法滿足火爆的體驗(yàn)需求。開發(fā)者把服務(wù)遷移到了上面剛說的智譜清言上面。   

這些模擬器之所以走紅出圈,關(guān)鍵還是在于模擬得準(zhǔn),不太出低級(jí)錯(cuò)誤,不讓人出戲。這體現(xiàn)出了作者對(duì)大模型微調(diào)訣竅的精通程度。

其實(shí)視智未來覺得,這種在機(jī)制設(shè)計(jì)上比較成熟的模擬器,如果可以自由切換底層模型的話,倒不如開源出來,作為一個(gè)變相的大模型評(píng)測基準(zhǔn)??赡鼙饶切┎粩啻痤}的測試會(huì)有用一些,也免得動(dòng)不動(dòng)就說某某模型又超越GPT-4啦。

04 AIGC元年,AI春晚也來了  

在各種由技術(shù)進(jìn)步帶來的春節(jié)新民俗當(dāng)中,春晚可以被稱為是“皇冠上的明珠”,嗯,我知道這個(gè)詞有點(diǎn)俗。

在UGC初出茅廬的時(shí)候,人們憋著一股勁,想要證明草根也是可以做高水平的節(jié)目的。這可能就是AB兩站春晚的萌芽。B站跨年和拜年祭,現(xiàn)在已經(jīng)是全站的明星活動(dòng),同時(shí)也是維系10余年來從二次元到國潮不斷變化的主流人群,凝聚所有人心的一個(gè)最大公約數(shù)。

而在AIGC概念翻紅的第一年,我們就能看到一場AI春晚的誕生。

這場AI春晚,號(hào)稱有十幾家AI工作室同時(shí)參與策劃,4個(gè)多小時(shí)一共有40多個(gè)節(jié)目。   

翻看他們的節(jié)目單,大部分都還是我們熟知的文生圖基礎(chǔ)上的視頻生成,充分利用了目前AI工具特有的風(fēng)格化特點(diǎn)。比起早前的炫技成分,現(xiàn)在在技術(shù)落地,參加廠商贊助的大賽等過程中,作者們更重要的是考慮如何將這種特異性的風(fēng)格,用來敘述一個(gè)可用的故事。

當(dāng)然也完全可以預(yù)測,由于模型主要依賴其自有知識(shí),而且有些效果好的工具屏蔽了100年內(nèi)有版權(quán)的形象IP,和現(xiàn)當(dāng)代名人的形象生成,因此這里面講歷史的作品很顯然會(huì)更多一點(diǎn)。

而在所有這些節(jié)目當(dāng)中,其實(shí)生產(chǎn)難度最大的,沒準(zhǔn)應(yīng)該是生成小品。這是因?yàn)?,河豚君自己也嘗試了一下做小品這件事,體會(huì)到了其中的艱辛。

我們自己也使用多種AI工具復(fù)合的測試了一下,但是說實(shí)在的,效果還是一般。   

比如ChatGPT被要求選擇過去一年熱門話題和網(wǎng)絡(luò)流行語的時(shí)候,結(jié)合人類同事的一些提點(diǎn),他成功地向我們講述了一個(gè)智能音箱在夫妻、婆婆三人交談時(shí)不合時(shí)宜的插話,最后導(dǎo)致誤會(huì)并解決誤會(huì)的故事思路。

但是后來,它就直接罷工:

當(dāng)然這很可能是來自O(shè)penAI方面的限制,原因則不排除是有些學(xué)校的學(xué)生用它來寫論文,要盡量防止代寫作業(yè)的情況。

既然人家不情愿,我們也不能逼他。   

但是,有一點(diǎn)不得不提:

目前,不論是生成一個(gè)較長的視頻片段,還是用AI去寫小說、寫劇本、寫小品,其中無可避免都要涉及一個(gè)最使用人力的過程——就是“挑”。

前一段時(shí)間,荷蘭著名光刻機(jī)廠阿斯麥(ASML)在YouTube上公開了一段時(shí)長三分多鐘的廣告,全都是使用Midjourney,Stable Diffusion和Gen-2等工具來生成的。但是在整個(gè)生成的過程當(dāng)中,作廢的片段很多,最終要手動(dòng)挑選并且連在一起。

據(jù)官方表示,該內(nèi)容的創(chuàng)作耗費(fèi)了多達(dá)1963 個(gè)Midjourney 提示,提供了約 7852 張不同的圖片,然后使用 Runway Gen-2 對(duì)這些圖片進(jìn)行了編譯。在整個(gè)廣告中,最復(fù)雜的部分是"艾薩克·牛頓"部分,主要是因?yàn)樗婕暗揭淮味鄠€(gè)形體轉(zhuǎn)換,這很難實(shí)現(xiàn)。

截至目前,在文生視頻方面,或者像我們所說的文學(xué)創(chuàng)作中,AI工具要想出好結(jié)果,仍然嚴(yán)重依賴于創(chuàng)作者本人是否具有此前的從業(yè)經(jīng)驗(yàn)和審美。

但是在普及化之前,就讓我們先享受當(dāng)下的AI——

把使用通義照相館生成的虛擬全家福打出來掛在墻上;   

手里拿著七大姑八大姨模擬器,像使用谷歌翻譯一樣對(duì)答親屬的提問;

然后再打開電腦或手機(jī),看一看AI春晚。

最后,咱再貼一副大模型給做的對(duì)聯(lián):

文案:ChatGPT;圖片:阿里通義實(shí)驗(yàn)室AnyText

齊活兒!

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

龍年春節(jié),AIGC帶來哪些“新年俗”?

人工智能正在擁抱生活的每一個(gè)角落。

圖片來源:界面新聞 匡達(dá)

文|娛樂資本論 James

馬上就過年啦!你家里過年有什么習(xí)俗呢?

原先,是聚在一起放鞭炮,吃一頓團(tuán)圓飯,不論主食是餃子還是米飯。八九十年代,電視機(jī)里看春晚成了一條新增的民俗。接下來,移動(dòng)互聯(lián)網(wǎng)的興起,又讓電子紅包替代了“實(shí)體紅包”和紙幣。

要說過去的一年有什么新技術(shù)最火爆,那肯定是AIGC了。面對(duì)大模型如雨后春筍般出現(xiàn),文生圖工具解放了普通人作畫的門檻,越來越多的自動(dòng)回復(fù)開始變得更智能……我們很好奇。AIGC會(huì)給2024年的春節(jié)帶來怎樣的新民俗呢?

01 百度:三款主要產(chǎn)品批量上新

首先,我們得一起來梳理一下“大廠”們交的答卷。

百度旗下三款主流應(yīng)用——百度APP、文心一言和百度網(wǎng)盤,都在春節(jié)期間批量上新。

文心一言可以生成數(shù)字分身,使用照片、人聲并指定性格,可以輸出一個(gè)對(duì)話模型,并使用你的音色回答問題。

它的性格設(shè)定用了MBTI的概念,說不準(zhǔn)可以看到另一個(gè)次元壁上的自己是啥樣。遺憾的是,照片只不過是用作頭像,如果要做數(shù)字人拜年視頻的話還是不行的。

另外,如果單論輸出音色,其實(shí)剪映目前也在內(nèi)測生成音色功能,據(jù)說很快就要全量上線。這樣,你就不用在孫悟空和派大星那些里面選來選去了。   

在百度APP可以使用寫祝福、畫頭像、畫龍、拍寫真這些功能,祝福語也可以寫藏頭詩。

百度網(wǎng)盤的云一朵智能助手,將其中的星座運(yùn)勢功能稍加改動(dòng)變成了生肖運(yùn)勢預(yù)測,你覺得他說的靈驗(yàn)嗎?

02 阿里:全民舞王再顯神通  

阿里的通義千問,年初以“全民舞王”這個(gè)小游戲走紅,娛樂資本論·視智未來也對(duì)其背后的技術(shù)研發(fā)團(tuán)隊(duì)做了個(gè)詳盡的專訪。

在過年期間,通義千問將全民舞王、通義萬相、通義照相館三個(gè)特別功能都做了春節(jié)特別安排。

“通義萬相”是經(jīng)典的作圖工具,新增的“萬物成龍”功能讓萌寵、風(fēng)景、靜物等圖片都可以生成類似風(fēng)格的龍,我們?cè)嚵嗽囕斎牒与嗑?nbsp;  

 

 

新春版全民舞王新增了幾個(gè)能添加舞伴的動(dòng)作模板,正如他們預(yù)告的那樣,“今年計(jì)劃加入的新功能,至少包括多人共舞和上傳半身照片”,當(dāng)然這么快就出來也是讓人沒想到的。

至于“通義照相館”,可以在同一張照片當(dāng)中,引入最多5名不同的家庭成員,用自己5張正面照片所制作的數(shù)字影像模型(LoRA)合影。

他們預(yù)設(shè)的模板涵蓋了一些影樓常見的全家福照片的風(fēng)格。我試了一下,效果還不錯(cuò),至少能看出是我的臉。

目前在阿里的各個(gè)部門中,對(duì)AI技術(shù)的應(yīng)用,似乎是在進(jìn)行“賽馬機(jī)制”。眾所周知的妙鴨相機(jī),跟通義照相館也是采取獨(dú)立發(fā)展的路線。而在支付寶APP當(dāng)中,也有另一個(gè)不太起眼的AI應(yīng)用。

支付寶“集五?!币呀?jīng)接近尾聲,有一種途徑,是在畫面當(dāng)中“找不同”的方式來找福字。他們使用ControlNet類似的方式將福字嵌入到AI文生圖當(dāng)中,每個(gè)圖當(dāng)中會(huì)有1~2個(gè)福字,很容易發(fā)現(xiàn)并且用手點(diǎn)出來。據(jù)說功能上線也就一兩天時(shí)間,已經(jīng)生成了10萬多張帶有福字的圖片。   

03 智譜:收編網(wǎng)紅“家族群模擬器”  

在大廠之外,有多個(gè)個(gè)人和機(jī)構(gòu)開發(fā)者都瞄準(zhǔn)了大語言模型能進(jìn)行情景模擬的優(yōu)點(diǎn)。過去一個(gè)月當(dāng)中,已經(jīng)有多款模擬器類產(chǎn)品出現(xiàn),直接針對(duì)過年場景的更是不少。

有清華血統(tǒng)的智譜清言一口氣推出了好幾個(gè)模擬器,其中包括“七大姑八大姨模擬器”,還有為家庭聚會(huì)準(zhǔn)備游戲,或者是如何表現(xiàn)高情商等等。   

當(dāng)然這些選單點(diǎn)擊過去之后,也有一定概率會(huì)發(fā)現(xiàn),它生成的答案并非那么特異性。不過我們要重點(diǎn)講講模擬七大姑八大姨的模擬器,它背后還有一個(gè)小插曲。

與僅僅使用prompt調(diào)節(jié)的場景模擬相比,由Chatmind AI開發(fā)的一個(gè)家族群模擬器《決戰(zhàn)拜年之巔》就進(jìn)行了更周到細(xì)致的,全方位的模擬,其效果也更逼真一點(diǎn)。Chatmind是獨(dú)立團(tuán)隊(duì)開發(fā)的大模型驅(qū)動(dòng)的思維導(dǎo)圖產(chǎn)品,之前使用的基底大模型是GPT-4。   

在前兩天被媒體廣泛報(bào)道之后,該模擬器經(jīng)過多次擴(kuò)容,仍然無法滿足火爆的體驗(yàn)需求。開發(fā)者把服務(wù)遷移到了上面剛說的智譜清言上面。   

這些模擬器之所以走紅出圈,關(guān)鍵還是在于模擬得準(zhǔn),不太出低級(jí)錯(cuò)誤,不讓人出戲。這體現(xiàn)出了作者對(duì)大模型微調(diào)訣竅的精通程度。

其實(shí)視智未來覺得,這種在機(jī)制設(shè)計(jì)上比較成熟的模擬器,如果可以自由切換底層模型的話,倒不如開源出來,作為一個(gè)變相的大模型評(píng)測基準(zhǔn)??赡鼙饶切┎粩啻痤}的測試會(huì)有用一些,也免得動(dòng)不動(dòng)就說某某模型又超越GPT-4啦。

04 AIGC元年,AI春晚也來了  

在各種由技術(shù)進(jìn)步帶來的春節(jié)新民俗當(dāng)中,春晚可以被稱為是“皇冠上的明珠”,嗯,我知道這個(gè)詞有點(diǎn)俗。

在UGC初出茅廬的時(shí)候,人們憋著一股勁,想要證明草根也是可以做高水平的節(jié)目的。這可能就是AB兩站春晚的萌芽。B站跨年和拜年祭,現(xiàn)在已經(jīng)是全站的明星活動(dòng),同時(shí)也是維系10余年來從二次元到國潮不斷變化的主流人群,凝聚所有人心的一個(gè)最大公約數(shù)。

而在AIGC概念翻紅的第一年,我們就能看到一場AI春晚的誕生。

這場AI春晚,號(hào)稱有十幾家AI工作室同時(shí)參與策劃,4個(gè)多小時(shí)一共有40多個(gè)節(jié)目。   

翻看他們的節(jié)目單,大部分都還是我們熟知的文生圖基礎(chǔ)上的視頻生成,充分利用了目前AI工具特有的風(fēng)格化特點(diǎn)。比起早前的炫技成分,現(xiàn)在在技術(shù)落地,參加廠商贊助的大賽等過程中,作者們更重要的是考慮如何將這種特異性的風(fēng)格,用來敘述一個(gè)可用的故事。

當(dāng)然也完全可以預(yù)測,由于模型主要依賴其自有知識(shí),而且有些效果好的工具屏蔽了100年內(nèi)有版權(quán)的形象IP,和現(xiàn)當(dāng)代名人的形象生成,因此這里面講歷史的作品很顯然會(huì)更多一點(diǎn)。

而在所有這些節(jié)目當(dāng)中,其實(shí)生產(chǎn)難度最大的,沒準(zhǔn)應(yīng)該是生成小品。這是因?yàn)?,河豚君自己也嘗試了一下做小品這件事,體會(huì)到了其中的艱辛。

我們自己也使用多種AI工具復(fù)合的測試了一下,但是說實(shí)在的,效果還是一般。   

比如ChatGPT被要求選擇過去一年熱門話題和網(wǎng)絡(luò)流行語的時(shí)候,結(jié)合人類同事的一些提點(diǎn),他成功地向我們講述了一個(gè)智能音箱在夫妻、婆婆三人交談時(shí)不合時(shí)宜的插話,最后導(dǎo)致誤會(huì)并解決誤會(huì)的故事思路。

但是后來,它就直接罷工:

當(dāng)然這很可能是來自O(shè)penAI方面的限制,原因則不排除是有些學(xué)校的學(xué)生用它來寫論文,要盡量防止代寫作業(yè)的情況。

既然人家不情愿,我們也不能逼他。   

但是,有一點(diǎn)不得不提:

目前,不論是生成一個(gè)較長的視頻片段,還是用AI去寫小說、寫劇本、寫小品,其中無可避免都要涉及一個(gè)最使用人力的過程——就是“挑”。

前一段時(shí)間,荷蘭著名光刻機(jī)廠阿斯麥(ASML)在YouTube上公開了一段時(shí)長三分多鐘的廣告,全都是使用Midjourney,Stable Diffusion和Gen-2等工具來生成的。但是在整個(gè)生成的過程當(dāng)中,作廢的片段很多,最終要手動(dòng)挑選并且連在一起。

據(jù)官方表示,該內(nèi)容的創(chuàng)作耗費(fèi)了多達(dá)1963 個(gè)Midjourney 提示,提供了約 7852 張不同的圖片,然后使用 Runway Gen-2 對(duì)這些圖片進(jìn)行了編譯。在整個(gè)廣告中,最復(fù)雜的部分是"艾薩克·牛頓"部分,主要是因?yàn)樗婕暗揭淮味鄠€(gè)形體轉(zhuǎn)換,這很難實(shí)現(xiàn)。

截至目前,在文生視頻方面,或者像我們所說的文學(xué)創(chuàng)作中,AI工具要想出好結(jié)果,仍然嚴(yán)重依賴于創(chuàng)作者本人是否具有此前的從業(yè)經(jīng)驗(yàn)和審美。

但是在普及化之前,就讓我們先享受當(dāng)下的AI——

把使用通義照相館生成的虛擬全家福打出來掛在墻上;   

手里拿著七大姑八大姨模擬器,像使用谷歌翻譯一樣對(duì)答親屬的提問;

然后再打開電腦或手機(jī),看一看AI春晚。

最后,咱再貼一副大模型給做的對(duì)聯(lián):

文案:ChatGPT;圖片:阿里通義實(shí)驗(yàn)室AnyText

齊活兒!

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。