文|自象限 程心
編輯|周游
大模型的風(fēng),吹動(dòng)虛擬數(shù)字人廠商野蠻生長(zhǎng)(以下統(tǒng)稱虛擬人)。
《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》預(yù)計(jì),到2030年我國(guó)虛擬數(shù)字人整體市場(chǎng)規(guī)模將達(dá)到2700億元,其中,“服務(wù)型虛擬人”總規(guī)模也將超過(guò)950億元。
如同禿鷹盯上腐肉,嗅到萬(wàn)億商機(jī)的各方勢(shì)力,都欲分一杯羹,這也直接導(dǎo)致了目前的虛擬人玩家格局陷入了“混戰(zhàn)”狀態(tài)。
「自象限」根據(jù)各方數(shù)據(jù)不完全統(tǒng)計(jì),目前國(guó)內(nèi)虛擬數(shù)字人核心廠商約有6000家。而按天眼查的數(shù)據(jù)顯示,相關(guān)廠商數(shù)量甚至超過(guò)6萬(wàn)家。
同時(shí),隨著大模型(Large Model)的興起,虛擬人的產(chǎn)業(yè)格局也在發(fā)生深刻變化。
比如,虛擬人正在經(jīng)歷從制作流程降本到技術(shù)突破的關(guān)鍵階段,從大語(yǔ)言模型到多模態(tài)能力,讓虛擬人從展示突破到了實(shí)時(shí)互動(dòng),這意味著未來(lái)虛擬人可能只需要一個(gè)實(shí)時(shí)渲染的外觀,就能擁有十分逼真的溝通能力。技術(shù)門檻的降低,也會(huì)讓更多參與方加入到這個(gè)開(kāi)拓中的市場(chǎng)。而狂奔半年后,百億個(gè)虛擬人也逐漸滲透進(jìn)各行各業(yè),并逐步進(jìn)入商業(yè)化階段。
也就是說(shuō),在廠商“混戰(zhàn)”的表面下,隱藏的不僅是巨大的商業(yè)利益,更是復(fù)雜的技術(shù)博弈。而牽動(dòng)著虛擬人“木偶引線”的另一頭,操控者們的世界也在發(fā)生翻天覆地的變化。
01 千億市場(chǎng),廠商“混戰(zhàn)”
如果說(shuō)元宇宙時(shí)期的虛擬人已經(jīng)是一把大火,那大模型就相當(dāng)于在這之上又烹上了一勺油。一瞬間,鋪天蓋地的數(shù)字人廠商涌來(lái),將本就復(fù)雜的行業(yè)攪得愈發(fā)渾濁。
這其中,既包括從元宇宙時(shí)期就一直堅(jiān)持虛擬數(shù)字人的廠商,也有依靠全棧技術(shù)優(yōu)勢(shì)輕松邁出第一步的大廠,更不乏聞風(fēng)而來(lái)的換道廠商。
「自象限」初步了統(tǒng)計(jì)核心廠商的類型后發(fā)現(xiàn),這些廠商大致可以分為四類:
圖為自象限原創(chuàng)
第一類是互聯(lián)網(wǎng)大廠,如騰訊、百度、阿里、京東、網(wǎng)易等。這里面其實(shí)也分兩類,一類是騰訊、百度為代表,他們業(yè)務(wù)龐大,在面向To B的解決方案上,比如金融、文旅、汽車等場(chǎng)景,需要一個(gè)數(shù)字人形象來(lái)符合新的交互方式。對(duì)于這些企業(yè),數(shù)字人只是業(yè)務(wù)的一個(gè)補(bǔ)充。另一類則是網(wǎng)易為代表的,具有技術(shù)積累的企業(yè),由于網(wǎng)易在游戲建模、AI捏臉等方面豐富的探索和技術(shù)積累,讓他們需要通過(guò)虛擬人將這些沉淀的資源轉(zhuǎn)化。
第二類是原生廠商。這是較早布局?jǐn)?shù)字人的一批廠商,如即構(gòu)科技、魔琺科技、硅基智能、風(fēng)平智能、數(shù)字栩生、相芯科技等。這類廠商或?qū)儆谏弦徊ㄔ钪鎰?chuàng)業(yè)的“遺珠”,或?qū)儆谑袌?chǎng)早期以電商直播帶貨、本地生活直播等場(chǎng)景切入數(shù)字人場(chǎng)景的公司,得益于AIGC技術(shù),其中的一些公司完成了從2D數(shù)字人到3D數(shù)字人的升級(jí)。
第三類是換道廠商?;谠屑夹g(shù)延伸入局?jǐn)?shù)字人賽道,如:商湯、華為、科大訊飛、快手、360、美圖、蔚領(lǐng)時(shí)代、元境科技、新壹科技等。這類廠商在發(fā)展過(guò)程中積累了一些涉及數(shù)字人的技術(shù)。譬如商湯的視覺(jué)識(shí)別技術(shù)、科大訊飛的語(yǔ)言識(shí)別技術(shù)、蔚領(lǐng)時(shí)代的游戲渲染技術(shù)等等,以這些技術(shù)為突破口再結(jié)合大模型的發(fā)展,完成了賽道的轉(zhuǎn)換。
第四類是跨界廠商。他們因?yàn)樽陨順I(yè)務(wù)場(chǎng)景需求而下探數(shù)字人技術(shù),如萬(wàn)興科技、藍(lán)色光標(biāo)、謙尋、高途、中公教育等。這類廠商的特點(diǎn)是其原本業(yè)務(wù)與數(shù)字人并無(wú)太大交集,如萬(wàn)興科技主營(yíng)業(yè)務(wù)是提供文圖、剪輯類的基礎(chǔ)工具,衍生出為客戶提供數(shù)字人工具;藍(lán)色光標(biāo)的主要業(yè)務(wù)為廣告業(yè)務(wù),通過(guò)數(shù)字人可以更好的完成客戶的需求;而謙尋則是一家MCN公司。但隨著應(yīng)用和場(chǎng)景的拓展,數(shù)字人成為了其新的發(fā)力方向,萬(wàn)興科技借數(shù)字人進(jìn)一步開(kāi)拓了海外直播、營(yíng)銷業(yè)務(wù),謙尋借由數(shù)字人找尋到了新一輪直播帶貨流量、成交額增長(zhǎng)動(dòng)力。
源于“出身”的不同,不同廠商的商業(yè)模式和目標(biāo)也完全不同。
大廠的虛擬人多為服務(wù)自身核心戰(zhàn)略而生,比如阿里、京東的虛擬人多被應(yīng)用在電商領(lǐng)域;騰訊將移動(dòng)互聯(lián)網(wǎng)時(shí)代積累下來(lái)的RTC(實(shí)時(shí)通信技術(shù))應(yīng)用在虛擬人交互中,打造了智影制作平臺(tái);百度希壤更偏向于表演型虛擬人,為不同企業(yè)提供定制化代言人;而網(wǎng)易則將虛擬人應(yīng)用在游戲、教育等多個(gè)自身業(yè)務(wù)中。總的來(lái)說(shuō),互聯(lián)網(wǎng)大廠并沒(méi)有急于將虛擬人獨(dú)立對(duì)外商業(yè)化,而是受自身技術(shù)的積累和場(chǎng)景需求催生。
核心對(duì)外提供服務(wù)的主要是原生的數(shù)字人廠商和換道廠商,從上個(gè)風(fēng)口到如今,這類廠商已經(jīng)積累了數(shù)字人的技術(shù)經(jīng)驗(yàn),對(duì)于底層技術(shù)、細(xì)節(jié)把控和場(chǎng)景的探索都有著更為體系化的認(rèn)知。根據(jù)技術(shù)路線的不同,原生廠商又被分為2D廠商和3D廠商,2D廠商更傾向于虛擬人與場(chǎng)景的結(jié)合,而3D廠商則處于技術(shù)迭代的狀態(tài)。
“2D虛擬人制作有兩種方式,一種是請(qǐng)真人錄制,然后幫其定制形象。一種是從用戶提供的視頻中提取形象,再用到各種場(chǎng)景中。但是2D數(shù)字人沒(méi)辦法做到3D那樣轉(zhuǎn)身、跳舞、做各種動(dòng)作?!奔礃?gòu)科技對(duì)二者的制作差異進(jìn)行了詳細(xì)解釋。
但由于2D虛擬人的制作成本低,帶動(dòng)了整個(gè)虛擬人市場(chǎng)“飛入尋常百姓家”,填補(bǔ)了市場(chǎng)由于價(jià)格攔路而不能落地的需求鴻溝?!缸韵笙蕖沽私獾剑壳霸瓘S廠商是大公司和品牌側(cè)傾向的選擇,通過(guò)行業(yè)KA客戶打造標(biāo)桿案例,比如銀行、大型消費(fèi)品品牌(健力寶)、美妝品牌(HR赫蓮娜)等等。
換道廠商和跨界廠商有異曲同工之筆,如商湯、美圖等換道廠商,在上個(gè)階段積累了CV、圖像識(shí)別等技術(shù),被應(yīng)用在了虛擬人的制作中,而像藍(lán)標(biāo)、謙尋等公司,源于自身的需求出發(fā),為了避免高昂的采購(gòu)成本,也選擇自研虛擬人,技術(shù)不夠硬核但有固定的客戶群,商業(yè)化冷啟動(dòng)相對(duì)迅速。
02 產(chǎn)品成熟,重在交付
今年8月、9月開(kāi)始,虛擬人廠商產(chǎn)品開(kāi)始加速迭代。據(jù)不完全統(tǒng)計(jì),兩個(gè)月內(nèi)至少有10家廠商發(fā)布了新的虛擬人產(chǎn)品。
產(chǎn)品的高度迭代意味著虛擬人正在飛快得適應(yīng)市場(chǎng)需求,而這也意味著虛擬人第一階段的賽點(diǎn)已經(jīng)走入關(guān)鍵階段。
從類型來(lái)看,虛擬人廠商分為兩類,一類直接交付虛擬人產(chǎn)品,包括通用虛擬人產(chǎn)品、行業(yè)垂直場(chǎng)景的虛擬人產(chǎn)品,比如電商、零售、營(yíng)銷、直播等,客戶即拿即用,或標(biāo)準(zhǔn)化或定制化;另一類則提供虛擬人制作平臺(tái),客戶通過(guò)使用平臺(tái)提供的工具,自主生產(chǎn)虛擬人。
相比之下,產(chǎn)品交付類型更適合企業(yè)探索虛擬人初期,幾乎不需要技術(shù)團(tuán)隊(duì)配合,門檻更低,也是目前較多企業(yè)選擇的方式。
針對(duì)這類產(chǎn)品形式,虛擬人廠商也提供了多樣的購(gòu)買方案。如汽車試駕一樣,品牌在購(gòu)買虛擬人之前,可以先可進(jìn)行Demo的試用,真實(shí)感受虛擬人的表情、動(dòng)作、交互等等。除此之外,品牌在購(gòu)買前還可以進(jìn)行方案咨詢,廠商會(huì)根據(jù)客戶情況,制定具體的虛擬人傳播方案,并有多種不同風(fēng)格的虛擬人可以選擇。
以即構(gòu)虛擬人Avatar為例,企業(yè)可選擇擬人形象和Q版形象,并可以在線直接體驗(yàn)給虛擬人換裝、捏臉,并通過(guò)AI完成了表情驅(qū)動(dòng)、聲音驅(qū)動(dòng)、文本驅(qū)動(dòng)、肢體驅(qū)動(dòng)等全方位的驅(qū)動(dòng)方式。
圖源:即構(gòu)官網(wǎng)截圖
提供制作平臺(tái)的廠商產(chǎn)品則更加復(fù)雜,如魔琺科技的三款產(chǎn)品分別針對(duì)了不同場(chǎng)景進(jìn)行,包括虛擬視頻、虛擬人直播和獨(dú)立的虛擬人服務(wù),并且在后端打造了端到端的寫實(shí)3D虛擬人工業(yè)化產(chǎn)線,包括從技術(shù)到調(diào)試到運(yùn)營(yíng)的“星云平臺(tái)”,讓虛擬人能夠和大模型結(jié)合,長(zhǎng)出“腦子”,真正實(shí)現(xiàn)3D交互。
圖源:魔琺科技發(fā)布會(huì)
今年8月,魔琺科技升級(jí)了有言AIGC生成平臺(tái)、有光直播帶貨平臺(tái)和有靈虛擬人制作平臺(tái),為企業(yè)提供系列生成工具,企業(yè)根據(jù)自身需求,能夠更加靈活的調(diào)整虛擬人的細(xì)節(jié)、結(jié)構(gòu)和適配的使用場(chǎng)景。
相比之下,商湯既能夠直接交付虛擬人產(chǎn)品,也打造了如影虛擬人制作平臺(tái),基于在視覺(jué)、語(yǔ)音領(lǐng)域積累的3萬(wàn)個(gè)算法模型,打造了集智能化生成、智能化驅(qū)動(dòng)、智能化交互的數(shù)字人平臺(tái)。在商湯智能化引擎驅(qū)動(dòng)下,虛擬人能快速識(shí)別、反應(yīng),與用戶建立起對(duì)話關(guān)系。并且,事后,虛擬人也不會(huì)“失憶”,繼續(xù)學(xué)習(xí)迭代。
這也說(shuō)明了,當(dāng)下廠商不僅是商業(yè)模式上的競(jìng)爭(zhēng),更是技術(shù)先進(jìn)性的比拼。
03 技術(shù)”三級(jí)跳“
從整個(gè)虛擬人的技術(shù)發(fā)展進(jìn)程來(lái)說(shuō),大模型帶來(lái)最核心的改變,是推動(dòng)著虛擬人從第一階段看起來(lái)“像人”,到能夠與人實(shí)時(shí)互動(dòng)。
圖為自象限原創(chuàng)
第一階段,虛擬人廠商比拼的是“誰(shuí)看起來(lái)更像人”?虛擬人廠商的核心技術(shù)多在傳統(tǒng)的CG(建模)技術(shù)、驅(qū)動(dòng)技術(shù)、渲染引擎等等,所以虛擬代言人為代表的表演型虛擬人成為了核心交付產(chǎn)品。
但由于技術(shù)的不成熟導(dǎo)致了虛擬人制作成本高企,「自象限」從行業(yè)內(nèi)人士了解到,2022年,某大廠提供的訂制虛擬人價(jià)格高達(dá)10萬(wàn),這讓虛擬人根本無(wú)法規(guī)?;涞亍?/p>
大模型來(lái)了之后,一方面讓虛擬人制作成本進(jìn)行了大幅度降低;另一方面,AI技術(shù)加速了虛擬人的交互功能,讓虛擬人交互起來(lái)更像人。
某虛擬人制作廠商曾吐槽:“以前6888元一個(gè),賣一個(gè)賠一個(gè)”,通過(guò)智能渲染、智能驅(qū)動(dòng),流程自動(dòng)化制作等能力,讓虛擬人的制作成本有了30%-50%的縮減,市面上甚至冒出了“99元、299元一個(gè)的虛擬人”。
更重要的是,大模型技術(shù)加速了虛擬人對(duì)語(yǔ)言語(yǔ)義的理解能力,讓虛擬人能夠從簡(jiǎn)單的檢索生成,到語(yǔ)言文字AI驅(qū)動(dòng),更快速的對(duì)人的需求進(jìn)行回復(fù),甚至做到“秒回”,同時(shí)模型也驅(qū)動(dòng)了渲染技術(shù)、擬真技術(shù)、超寫實(shí)技術(shù)的進(jìn)化。
舉個(gè)具體的例子:交互的核心并不只是動(dòng)作反饋,更是內(nèi)容的生成和語(yǔ)音的交流,故而,AIGC技術(shù)和語(yǔ)音生成技術(shù)成為了當(dāng)下技術(shù)發(fā)展的核心。
大模型讓虛擬人“長(zhǎng)了腦子”,有了思考和推理能力,AIGC技術(shù)讓虛擬人能夠有“想法”,TTS(Text To Speech文本轉(zhuǎn)語(yǔ)音技術(shù))技術(shù)則讓虛擬人能夠“表達(dá)”。
幾天前,在GPT-4V版本更新,TTS實(shí)現(xiàn)了進(jìn)步,文本驅(qū)動(dòng)語(yǔ)音有了語(yǔ)氣和口吻,在停頓、重音和自然交互程度上有了極大的提升。不僅可以模仿不同的口吻,甚至設(shè)定“渣女”時(shí)還學(xué)會(huì)了“夾子音”。
有行業(yè)專家推測(cè):TTS技術(shù)端到端成熟后,對(duì)行業(yè)格局的改變會(huì)很大。因?yàn)樘摂M人真的能夠?qū)崟r(shí)交互后,落到產(chǎn)業(yè)里才能產(chǎn)生實(shí)際價(jià)值。
從看起來(lái)像人,到實(shí)時(shí)互動(dòng),大模型推動(dòng)著虛擬人完成二級(jí)階躍,但這也只是一個(gè)新的開(kāi)始。從元宇宙到大模型時(shí)代,虛擬人真正備受關(guān)注的內(nèi)在原因在于,他將有可能是下一個(gè)虛擬時(shí)代的“入口”,背后連接著新的虛擬世界,入口屬性讓其變的既性感又危險(xiǎn)。
國(guó)外最早布局虛擬人的微軟小冰CEO李笛則認(rèn)為:虛擬人未來(lái)是混合模型。
本質(zhì)上,這兩種觀點(diǎn)的內(nèi)核是一致的,只不過(guò)李笛的假設(shè)更為具體。下一階段,將進(jìn)入“虛擬人+”的階段,虛擬人+RPA在企業(yè)內(nèi)部打造數(shù)字員工;虛擬人+AI Agent,在C端打造陪伴型機(jī)器人;虛擬人+AR/VR,在3D空間打造可見(jiàn)的游戲NPC;虛擬人+具身智能,讓人型機(jī)器人有了靈魂。
若將多種技術(shù)進(jìn)行全面融合,虛擬人才真的能夠成為“入口級(jí)應(yīng)用”。屆時(shí),比拼的賽點(diǎn)將是虛擬人的開(kāi)放程度、生態(tài)建設(shè)、場(chǎng)景拓展等一系列綜合能力。
當(dāng)虛擬人被賦予了更多能力,其背后的木偶引線到底還能否掌握在人的手里?
這個(gè)答案,也著實(shí)讓人期待。