文|市值榜 武占國
編輯|賈樂樂
1903年,園藝學首先發(fā)明了“克隆”這個詞匯,100年后,不僅植物可以克隆,羊可以克隆、猴子也可以克隆,甚至人也可以被克隆了。
只是礙于倫理問題,克隆人的研究一直被限制。最近,隨著AI的火熱,AI克隆人出現(xiàn)了。微軟小冰推出的AI克隆人,就像一個真實存在的網(wǎng)友,“他”有自己的朋友圈,可以陪你文字聊天,語音聊天,甚至還能視頻聊天。
再往前,AI孫燕姿翻唱了《發(fā)如雪》,一夜之間爆火全網(wǎng),孫燕姿本人稱自己的粉絲已改換門庭。
其實,早在1927年,無聲電影《大都會》中就出現(xiàn)了電影史上第一個AI虛擬角色——機器人瑪利亞,后來的米老鼠、日本的動漫,人們就用手繪動畫的方式展現(xiàn)二維虛擬形象。
只是,當時由于技術還不成熟,虛擬人的應用還處于萌芽階段,后來隨著計算機視覺和動捕技術的出現(xiàn),虛擬逐漸進入到探索階段,如今隨著AI時代的到來,虛擬人開始真正走進我們的生活。
無論是簡單的產(chǎn)品咨詢,還是直播行業(yè)、影視行業(yè),虛擬人看起來正在替代人類。那么,AI對虛擬人產(chǎn)業(yè)會帶來哪些改變?虛擬人產(chǎn)業(yè)的機會和風險有哪些?虛擬人是不是一門好生意?
一、AI技術重塑虛擬人
2022年7月12日,火了10年的虛擬偶像洛天依,第一次通過AI發(fā)聲:“唱響你心中的歌,我是虛擬歌手洛天依?!?/p>
這標志著,AI重塑虛擬偶像的時代正在到來。
2000年,電影《最終幻想:靈魂深處》首次用計算機視覺(CG)和動作捕捉技術,設計了三維虛擬形人。
當時的虛擬人主要是由真人通過動作捕捉驅動動畫形象,2016年底,號稱全球首位虛擬主播,4個月吸粉40萬,在Youtube開設“A.I.Channel”頻道的虛擬主播,依舊是使用真人驅動的虛擬偶像。
直到2018年,新華社聯(lián)合搜狗公司推出的全球首位3D版AI合成主播“新小微”,AI對虛擬人的改變才開始進入爆發(fā)期。
AI對虛擬人的改變包括外觀形象、行為表達、思想交互三個方面。
第一,AI對虛擬人外觀形象方面的改變,在于傳統(tǒng)的3D建模需要人通過軟件設計一個形象,而AI生成是通過算法和以往數(shù)據(jù)而生成的3D形象。
比如新華社的“新小微”就是以其職員趙琬微為原型,首先通過幾百個攝像頭對趙琬微身體部位360度全方位掃描,并對其多種形態(tài)的表情和動作進行捕捉記錄。然后再對“新小微”的各個部位和表情進行了模塊化處理,像拼樂高一樣重新組裝。
最后通過算法實現(xiàn)驅動和渲染構建出來的虛擬人模型,做到表情、唇動、肢體動作和語言表達的高度契合。
第二,行為表達方面,AI通過語音合成技術取代傳統(tǒng)真人配音模式,由AI直接生成語音,包括唱歌、新聞播報、演講、朗讀等等應用場景。
AI孫燕姿的爆火,就離不開2021年韓國科學院發(fā)布的開源AI語音合成模型VITS,在該語音模型基礎上開發(fā)的so-vits-svc項目,通過對孫燕姿歌曲、采訪等聲音的訓練,就有了AI孫燕姿。
第三,思想交互方面,大模型的出現(xiàn),讓AI通過大量人類數(shù)據(jù)集的訓練,思考和回答更接近人類,使虛擬人的交互更像人。
比如制作游戲的軟件Unreal Engine基本上實現(xiàn)虛擬人從“很像”到“很真”的跨越。4月,一款基于ChatGPT制作的游戲——《生成智能體:人類行為的交互式模擬》上線。
網(wǎng)易旗下開放世界武俠手游《逆水寒》讓智能NPC和玩家自由生成對話,并基于對話內(nèi)容,游戲中的人物自主給出行為反饋。
再就是微軟小冰,基于小冰框架開發(fā)的AI克隆人,第一批網(wǎng)紅半藏森林入入駐,不同的用戶聊天內(nèi)容不同,回復的內(nèi)容也不相同,更像是真人的交互。
二、誰能用虛擬人賺錢?
不僅僅是網(wǎng)易、微軟小冰,虛擬人世界還有更多的玩家。
6月6日,2023蘋果開發(fā)者大會在蘋果飛船總部大樓舉辦,大會上蘋果發(fā)布的混合現(xiàn)實(MR)頭盔,再次將人們的視野帶向元宇宙。隨著AI等技術的進步,元宇宙世界離我們越來越近。
虛擬人是元宇宙的構成要素和交互載體,作為真實人類的映射,虛擬人是運用動作捕捉、AI等技術復制真人(數(shù)字孿生)形象,以便在元宇宙當中,實現(xiàn)虛擬與現(xiàn)實的更強交互,具備更好的現(xiàn)實感。
當前虛擬人產(chǎn)業(yè)鏈可分為三層,分別是基礎層、平臺層和應用層。
基礎層提供基礎硬件和軟件支撐,比如顯示設備VR/AR眼鏡、建模軟件、渲染引擎。
基礎層做得好的多是國外的公司,比如Unity引擎,不僅可以做虛擬人,還能進行動畫、游戲等的支持,很多熱門游戲是通過Unity引擎開發(fā)完成的。
平臺層主要包括AI廠商和綜合性互聯(lián)網(wǎng)廠商等技術支持企業(yè)。
平臺層企業(yè)是對基礎層的軟硬件技術運用,并結合AI、計算機視覺(CG)等虛擬數(shù)字人技術,為應用層提供進一步技術支持和解決方案。
比如商湯、云從、依圖和曠視等AI四小龍,還有在語音識別領域做得比較好的科大訊飛。其他的還有像微軟、騰訊這樣提供一站式解決方案的企業(yè)。
這次虛擬半藏森林的開發(fā)公司——小冰,就是平臺提供商,同時也是應用層的提供商。
應用層的企業(yè)是將虛擬數(shù)字人技術與傳統(tǒng)行業(yè)進行融合,實現(xiàn)對傳統(tǒng)行業(yè)的改造。比如虛擬主持人、虛擬客服等。
從商業(yè)化和應用場景來看,虛擬人可以分為內(nèi)容/IP型、功能服務型、虛擬分身型3類。
內(nèi)容/IP型虛擬人,比如2021年爆火的虛擬美妝達人柳夜熙,這類虛擬人主要應用于影視、文娛、市場營銷等場景,功能服務型虛擬人主要應用于行業(yè)服務場景,比如電商的虛擬客服,這兩種類型虛擬數(shù)字人更多是面向B端。
虛擬分身類型數(shù)字人除了面向B端的應用,也面向C端,比如著名的咨詢專家劉潤,就定制了自己的虛擬形象,分身可以代替他進行直播等工作。
變現(xiàn)的機會分為兩種,利用數(shù)字人形象進行淘金的、向淘金者出售鏟子的。
劉潤的數(shù)字分身就屬于第一種,可以讓數(shù)字分身承擔工作,創(chuàng)造收益;樂華娛樂旗下虛擬偶像女團A—SOUL也屬于第一種,虛擬偶像女團和真實的偶像女團一樣,也可以通過向普通粉絲出售門票、周邊賺錢。
柳夜熙背后的創(chuàng)壹科技,既利用柳夜熙的直播和視頻獲取收益,同時也是個賣鏟子的。柳夜熙背后就有著150人技術驅動的中臺和強大的內(nèi)容戰(zhàn)略。
創(chuàng)壹科技,也曾憑借控雨的創(chuàng)意,創(chuàng)造出了爆火的素材,可供抖音龐大的其他用戶使用,截至2021年6月,排抖音特效使用榜單前十。
現(xiàn)在,虛擬數(shù)字人越來越智能化、形象化,應用也更普遍,那么虛擬數(shù)字人是不是一門好生意?
三、虛擬數(shù)字人是不是一門好生意?
虛擬人的應用尚處于發(fā)展早期,未來發(fā)展迅速幾乎是確定的方向。
艾瑞咨詢的研究報告顯示,2022年中國虛擬人帶動產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模分別為1866.1億元和120.8億元,預計2025年分別達到6402.7億元和480.6億元,呈現(xiàn)強勁的增長態(tài)勢。
目前,很多公司也的確因為虛擬人的應用獲得了可觀的收益。
2020年11月,A-SOUL火了之后,樂華娛樂的泛娛樂業(yè)務收入從2020年的2110萬元增長至2021年的3790萬元,主要原因便是虛擬藝人組合A—SOUL的商業(yè)發(fā)展產(chǎn)生的收益,A-SOUL還推動了樂華泛娛樂業(yè)務毛利率大幅轉正。
小冰公司推出的AI克隆人,付費模式有兩種:一種是“情感模式”是72元/年,可與克隆人語音通話、朋友圈互動;另一種是“超級模式”,360元/年,克隆人會成為用戶的辦公伙伴,提供撰寫文案等服務。
以“半藏森林”為例,如果有1萬個用戶付費,如果全部選擇情感模式,相當于“半藏森林”克隆人一年收入72萬元;如果選擇超級模式一年則可收入360萬元。
國外類似半藏森林的商業(yè)模式,今年5月2日,國外網(wǎng)紅Caryn Marjorie與初創(chuàng)企FV(Forever Voice)合作推出Caryn AI,是粉絲的“虛擬女友”。
Caryn預計,AI版本的自己能讓她收入翻60倍,年入6000萬美元(約4.16億元人民幣)。
金礦很大,但錢不一定好撈。
先說明一下,這里要討論的不是基礎層的一些大企業(yè),對他們而言,自身技術突破是戰(zhàn)略,不會用短期能否有較好的變現(xiàn)模式和變現(xiàn)空間來衡量,更多的是針對平臺層的部分公司以及對虛擬人的應用上。
第一,成本比較高,但收益不具有確定性。
B端需要的虛擬人,一般是用來代替人工作的,比如虛擬主播,本意是拉長直播時間、減少人力成本。
不過,就當前的AI技術而言,尚不能做到與真人無異,很多從事直播業(yè)務的人說數(shù)字直播間的流量不好。《豹變》的一篇文章稱,美ONE(李佳琦公司)工作人員表示,數(shù)字人會影響直播互動,這是直播最大的優(yōu)勢。
想讓數(shù)字人更接近于真人,就需要花更多的錢,比如劉潤的數(shù)字分身成本在百萬元級別。
優(yōu)質(zhì)的數(shù)字人還需要高額的運營成本,就像上文提到的需要超過百人的創(chuàng)意團隊,從2021年爆火到現(xiàn)在,柳夜熙在抖音的作品不過41個,第一條短視頻的制作成本就高達幾十萬元。
除了工具類型的,還有情感陪伴類型的虛擬人,超級模式下的虛擬半藏森林屬于二者結合。
不管是半藏森林還是Caryn,在推出虛擬人之前就已經(jīng)是知名人士,這并不好模仿。這一類數(shù)字人還面臨的風險在于用戶新鮮感喪失。
人們忠誠于一段關系,或是因為利益,或是因為志趣相投,或是怕被譴責,再或者別無選擇。而當以知名人物為原型的虛擬人足夠多時,人能合理合法地擁有無限的情感資源時,忠誠自然也就被拋之腦后了。
清華大學在《元宇宙發(fā)展研究報告3.0》中也表示,由于虛擬人成本高,如果后期運營乏力,將出現(xiàn)熱度衰退、用戶新鮮感喪失等問題,IP價值就會出現(xiàn)回落。
第二,存在監(jiān)管和法律風險。
比如侵權問題。近期爆火的AI孫燕姿,專家提出對于肖像權、聲音權、著作權、數(shù)據(jù)權,AI孫燕姿都可能會涉及侵權。
比如詐騙問題。近期,內(nèi)蒙古包頭警方就通報了一起案件,騙子通過AI換臉和擬聲技術,佯裝熟人實施詐騙,福州市某公司法人代表郭先生10分鐘內(nèi)被騙430萬元。
隨著技術的發(fā)展,更像人的虛擬數(shù)字人可能成本更低,更加適配的法律和監(jiān)管細則也會出臺,虛擬人產(chǎn)業(yè)會更加規(guī)范地發(fā)展,但在目前看來,成本和收益還談不上對等。