正在閱讀:

數(shù)字人,狂飆180天

掃一掃下載界面新聞APP

數(shù)字人,狂飆180天

市場火爆之下,企業(yè)們盯上的卻非同一塊蛋糕。

文|數(shù)智前線 徐鑫

編輯|任曉漁

大模型熱潮下,數(shù)字人賽道變得熱鬧起來。文旅、電商、金融等多個行業(yè),形形色色的虛擬數(shù)字人,正代替真人,扮演著代言人、主播、客服和智能助理的角色。

市場的參與者也肉眼可見變多。互聯(lián)網(wǎng)大廠、創(chuàng)業(yè)公司、老牌AI公司和一些此前做智能客服營銷的數(shù)字服務(wù)商都卷進(jìn)了這個賽道。IDC中國研究總監(jiān)盧言霞告訴數(shù)智前線,入口屬性是大量企業(yè)爭相布局這一賽道的原因。生成式AI熱潮下,數(shù)字人被視作未來使用自然語言與機(jī)器交互的入口級產(chǎn)品之一,推動了市場熱度提升。

2022年6月IDC在報告中預(yù)計,到2026年中國AI數(shù)字人市場規(guī)模將達(dá)到102.4億元人民幣。隨著熱度大增,數(shù)字人市場規(guī)??赡軐⒏爝_(dá)到這一水平。

值得一提的是,當(dāng)下仍處在大模型驅(qū)動數(shù)字人產(chǎn)品應(yīng)用落地的早期階段。一方面,業(yè)界認(rèn)為,數(shù)字人市場體量的變化要到明年有規(guī)?;涞睾蟛拍苷嬲谑袌龆擞兴w現(xiàn)?,F(xiàn)階段,技術(shù)成熟度、成本和效率等仍然是制約因素。另一方面,不同的廠商呈現(xiàn)出差異化競爭趨勢,企業(yè)正基于優(yōu)勢積累構(gòu)建自身的壁壘。

幾天前,GPT-4V版本更新,TTS(Text To Speech 文本轉(zhuǎn)語音技術(shù))進(jìn)步,文本驅(qū)動語音的表現(xiàn)在停頓、重音和交互自然程度上都有了極大提升。一些資深人士認(rèn)為,大模型驅(qū)動的數(shù)字人真正落地有望加速迎來爆發(fā)。

01 狂飆的數(shù)字人賽道

數(shù)字人賽道今年肉眼可見地火起來了。今年2月以來,“數(shù)字人”一詞的微信指數(shù)達(dá)到了去年十月的幾倍到幾十倍水平。

AI視頻直播SaaS創(chuàng)業(yè)公司特看科技CEO樂乘告訴數(shù)智前線,相比去年,今年整個賽道熱度明顯提升,前兩個月尤其明顯,呈現(xiàn)出泛濫乃至內(nèi)卷的狀態(tài)。

“去年就只有幾家在實驗,有點飄在半空中,主要是元宇宙、3D數(shù)字人方向,整體成本很高,很難商業(yè)化落地。今年一下子掉到地上來了。”

市場火爆下,也出現(xiàn)了一些亂象,有微商代理入場掘金。業(yè)內(nèi)人士統(tǒng)計,市面上大概有一千多家代理商在賣各種數(shù)字人。

大廠、創(chuàng)業(yè)團(tuán)隊、AI公司和一些此前做智能客服營銷的數(shù)字化服務(wù)商都在這一賽道頻繁動作。

大廠的布局其實早已有之。騰訊、百度、阿里、京東、火山引擎等平臺此前在元宇宙概念下或基于直播帶貨等多個場景,都推出過數(shù)字人產(chǎn)品平臺或服務(wù)。例如,騰訊云小微在2021年11月發(fā)布了數(shù)智人產(chǎn)品矩陣,提供3D超寫實、2D真人、2D卡通等五種風(fēng)格數(shù)智人產(chǎn)品。百度也在2021年AI開發(fā)者大會上發(fā)布了百度智能云曦靈平臺,具有數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)等功能,百度還打造出了“度曉曉”等數(shù)字人IP。

大模型到來后,廠商們推出新的數(shù)字人平臺,相比上一階段,制作效率和成本管理能力有大幅提升。騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊介紹,4月騰訊云發(fā)布的小樣本數(shù)智人生產(chǎn)平臺,12小時就能夠出來Demo,成本也大幅降至千元級別??焓衷诮衲?月發(fā)布的AIGC數(shù)字人產(chǎn)品快手智播,產(chǎn)品功能主打的也是降低制作門檻,3~5分鐘真人視頻和音頻素材,成本實現(xiàn)大幅降低。

知名的AI公司們緊鑼密鼓秀出了肌肉。今年4月,商湯科技在其技術(shù)交流日上展示了2D數(shù)字人視頻生成平臺“如影SenseAvatar”,官方介紹,僅需一段5分鐘的真人視頻素材,就可以生成出聲音及動作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身。7月世界人工智能大會上,如影升級到2.0版本,重點提升數(shù)字人在多語種的語音和口型的流暢度。

一些在數(shù)字人賽道投入已久的公司也積極推新。8月中旬,在3D虛擬人賽道投入已有5年的技術(shù)服務(wù)商魔琺科技一口氣出了視頻AIGC生成平臺、AIGC直播平臺和虛擬人服務(wù)AIGC平臺三款消費(fèi)級產(chǎn)品,從高質(zhì)量、低成本和規(guī)模化復(fù)制三個層面,降低3D虛擬人的應(yīng)用落地門檻。

熱潮還吸引了跨界玩家,典型的有薇婭旗下的直播MCN機(jī)構(gòu)謙尋控股布局。8月8日,謙尋控股旗下子公司謙語智能和羚客分別發(fā)布了AI數(shù)字人直播解決方案和一站式AI智能直播綜合服務(wù)平臺。

資深人士認(rèn)為,入口屬性是大量企業(yè)爭相布局這一賽道的原因?!吧墒紸I,未來的入口之一是數(shù)字人。今天用的是簡單web版,未來數(shù)字人可能體驗更豐富。也是這個原因,企業(yè)開始紛紛進(jìn)入這一市場?!北R言霞告訴數(shù)智前線。

魔琺科技創(chuàng)始人柴金祥在8月中旬的消費(fèi)級產(chǎn)品發(fā)布會上則把3D虛擬人視作未來的一種基礎(chǔ)設(shè)施?!跋窬W(wǎng)頁和APP一樣,作為一種內(nèi)容載體的升級,未來會重塑所有的行業(yè)”,柴金祥說。在這個認(rèn)知下,魔琺科技除了消費(fèi)級產(chǎn)品,還研發(fā)了3D虛擬人OS,用于管理未來的基礎(chǔ)設(shè)施。

嘗試將數(shù)字人形象和智能客服的對話能力結(jié)合的智能外呼公司云蝠智能看重的則是數(shù)字人的可互動性和未來的潛力。“最近有個表達(dá)我特別認(rèn)同,數(shù)字人其實就是大模型的 UI”,云蝠智能CEO魏佳星告訴數(shù)智前線,“把時間都拉到5~10年看,數(shù)字人可能是在創(chuàng)造硅基生命。今天只是可互動的數(shù)字人,沒有靈魂,并不代表未來它鉆不進(jìn)去靈魂?!?/p>

總體而言,大模型熱潮正在點燃數(shù)字人賽道。中航證券的一份報告指出,乘風(fēng)AI大模型的涌現(xiàn),虛擬數(shù)字人將加速釋放多元商業(yè)價值。數(shù)字人制造和運(yùn)營服務(wù)的B端市場不斷擴(kuò)大,將面向更廣大的C端用戶提供服務(wù),深耕數(shù)字人相關(guān)業(yè)務(wù)的企業(yè)有望迎來黃金發(fā)展期。

02 差異場景,各顯神通

市場火爆之下,企業(yè)們盯上的卻非同一塊蛋糕。

文旅、電商、金融和企業(yè)內(nèi)應(yīng)用等不同細(xì)分市場里,數(shù)字人的商業(yè)化前景也并不一致,樂乘認(rèn)為未來數(shù)字人更應(yīng)視作是一種能力,不同細(xì)分賽道對數(shù)字人專業(yè)能力要求也不同。

文旅行業(yè)數(shù)字人應(yīng)用不是新鮮事。數(shù)字人已經(jīng)在不少景區(qū)和文化機(jī)構(gòu),扮演了代言人或景區(qū)智能大屏里的智能導(dǎo)游角色。典型案例有以“敦煌飛天”為藍(lán)本打造的虛擬數(shù)字人“天妤”、中國文物交流中心的“文夭夭”、敦煌研究院的“伽瑤”、國家博物館的“艾雯雯”等。一家文旅公司提及,有了數(shù)字人后,一些歷史人物與游客個性化互動交流,展廳效果更豐富。

目前,百度、騰訊等不少廠商都在發(fā)力這一市場。幾個月前,一名百度的數(shù)字化服務(wù)商告訴數(shù)智前線,他們做了一個河北的項目,打的是文旅市場,千萬元級別。不過,也有行業(yè)人士提到,景區(qū)數(shù)字人并非單獨報價千萬,通常是整一套景區(qū)數(shù)字化解決方案中的一個能力,項目整體才能到千萬級別??傮w而言,相比一些企業(yè)內(nèi)服務(wù)場景里千元級別的應(yīng)用,文旅場景稱得上頭部市場。

IDC介紹,金融行業(yè)是當(dāng)下數(shù)字人應(yīng)用相對更成熟的領(lǐng)域。以銀行業(yè)為例,國內(nèi)最早“聘用”數(shù)字員工的是浦發(fā)銀行,3D數(shù)字人“小浦”在2019年由浦發(fā)銀行聯(lián)手百度智能云打造。據(jù)介紹,目前“小浦”已經(jīng)在20多個崗位任職,包括財富規(guī)劃師、文檔審核員、大堂經(jīng)理、電話客服等。9月初,IDC中國副總裁兼首席分析師武連峰在外灘大會銀行業(yè)數(shù)字化論壇發(fā)布《銀行數(shù)字科技五大趨勢》時提到,到2025年,超過80%的銀行都將部署數(shù)字人,承擔(dān)90%的客服和理財咨詢服務(wù)。

一位城商行財富管理版塊的IT負(fù)責(zé)人告訴數(shù)智前線,他們也打算采購部署一套數(shù)字人,當(dāng)下正處于緊鑼密鼓考察其他銀行的數(shù)字人方案及不同廠商產(chǎn)品等階段?!盎鶎訂T工有非常多指標(biāo),騰不出手來做更重要的工作”,該人士介紹,數(shù)字人可把他們從繁重的客服接待等工作中解放出來,去做更重要的客戶維護(hù)等運(yùn)維類工作。目前火山引擎、商湯科技、騰訊云、百度智能云、京東云等多家廠商都在金融行業(yè)里有數(shù)字人落地應(yīng)用案例。

電商直播場景里,不少頭部品牌已經(jīng)開始在嘗試數(shù)字人直播方案。樂乘介紹,大品牌樂于積極嘗試數(shù)字人與企業(yè)一把手的AI戰(zhàn)略有關(guān),高層提了擁抱AI后,中層就會在營銷等場景嘗試數(shù)字人工具。目前他們已經(jīng)服務(wù)了寶潔、歐萊雅等多個KA品牌,數(shù)據(jù)表現(xiàn)看數(shù)字人主播已經(jīng)達(dá)到了真人主播銷售額的70%。

數(shù)智前線了解到,電商直播場景里數(shù)字人服務(wù)模式有兩種:一種是給KA品牌提供了數(shù)字人直播軟件和代運(yùn)營的打包服務(wù),通常這個模式下每月報價在兩到三萬之間。另外一種是買一套軟件自己播,市場報價目前在兩千到四千之間。

看中直播市場的廠商不少,也出現(xiàn)了產(chǎn)品方案良莠不齊的現(xiàn)象,其中不乏“割韭菜”行為。一位電商行業(yè)資深人士介紹,目前使用數(shù)字人后數(shù)據(jù)好的品牌普遍特征是貨品本身有產(chǎn)品力,傳統(tǒng)無人直播方法也能賣得不錯,用了數(shù)字人之后效果再往上提升了幾成。

“那些吹噓數(shù)字人賣貨多么牛逼的數(shù)字人廠商,都是割韭菜,吹的越猛,鐮刀越鋒利?!痹撊耸空J(rèn)為,數(shù)字人當(dāng)下只是可以低成本規(guī)?;颜嫒四苜u好的貨能自動化完成銷售。

IDC指出,目前各類玩家的產(chǎn)品和解決方案在應(yīng)用方向上存在差異,企業(yè)都基于自身優(yōu)勢賽道來打造數(shù)字人的場景。大廠會有一定的優(yōu)勢,但小廠可以擇賽道而行,差異化競爭。

魏佳星告訴數(shù)智前線,他們切入數(shù)字人賽道,就選了一些又苦又累的場景。比如官網(wǎng)的客服用數(shù)字人又垂直又累,客單價還不高。普通的官網(wǎng)客服一般一年費(fèi)用在2000元,加一個數(shù)字人能力,價格可能不超過五千元。這是巨頭看不上的市場,一般的創(chuàng)業(yè)公司現(xiàn)在開始做,能力又追不上。這種差異化競爭是他們這類創(chuàng)業(yè)公司的機(jī)會。

03 規(guī)?;涞厍耙?/h4>

雖然聲量不小,動作頻頻,不過業(yè)內(nèi)普遍認(rèn)識到當(dāng)下仍然存在的挑戰(zhàn)。

盧言霞觀察,當(dāng)下大模型應(yīng)用尚未規(guī)?;涞兀矫髂瓴拍茉谑袌龆擞袛?shù)據(jù)變動。目前階段,數(shù)字人開發(fā)周期,開發(fā)成本,形象定制,真正的AIGC化,都是挑戰(zhàn)。

以技術(shù)成熟度為例,不少數(shù)字人產(chǎn)品在語音、表情、互動表現(xiàn)上目前還比較生硬。一些資深人士甚至認(rèn)為,不成熟的解決方案甚至?xí)褲撛诘目蛻粲脩粝闯隽耸袌觥?/p>

不過這波AIGC浪潮下,技術(shù)更迭速度也很快。樂乘告訴數(shù)智前線,他們看到此前大模型跟數(shù)字人結(jié)合在文本轉(zhuǎn)語音技術(shù)(TTS)有突破的跡象?!爸拔谋咀兂蓴?shù)字人的自然度有問題,銜接上一直不太容易。大模型是一條線,數(shù)字人是一條線。他們需要TTS技術(shù)突破,才能實現(xiàn)很好的融合?!?/p>

9月底,OpenAI新發(fā)布了版本更新 GPT-4V中,TTS技術(shù)由一個全新的TTS模型提供支持。它能夠僅從文本和幾秒鐘的樣本語音中生成類似人類的音頻,結(jié)合Whisper模型的語音轉(zhuǎn)文本,保證用戶與ChatGPT進(jìn)行語音交流的質(zhì)量和流暢度。

行業(yè)人士觀察,在一些用戶已經(jīng)灰度測試的新版本里,文本轉(zhuǎn)語音表現(xiàn)頗令人驚艷,AI在停頓、語氣和抑揚(yáng)頓挫感上已經(jīng)非常接近真人。“我判斷TTS技術(shù)端到端成熟后,對行業(yè)格局的改變會很大?!睒烦苏f,相當(dāng)于有了一個膠水,大模型驅(qū)動數(shù)字人從兩條線能夠結(jié)合到一起,企業(yè)后面去優(yōu)化數(shù)字人的表現(xiàn)力就可以了。

數(shù)字人產(chǎn)品的價值呈現(xiàn)及規(guī)?;瘡?fù)制能力也是業(yè)界關(guān)注的重點。

魔琺科技創(chuàng)始人柴金祥介紹,早期的虛擬人行業(yè)發(fā)展的一大痛點就是規(guī)模化復(fù)制問題。從長內(nèi)容時代的動畫、電影和游戲領(lǐng)域里的虛擬人到短內(nèi)容時代的虛擬偶像,例如初音未來、柳夜熙等,也包括魔琺早期打造的虛擬偶像翎__Ling都是手工制作,周期長,成本高。

一位觀察者提到,此前的頂流虛擬人偶像“柳夜熙”需要配備超百人的創(chuàng)意團(tuán)隊,制作一個作品的投入成本可能超過百萬級別。

柴金祥接受數(shù)智前線采訪時提到,魔琺的AIGC技術(shù)已突破內(nèi)容行業(yè)虛擬人此前無法被規(guī)?;瘡?fù)制的問題。此外,消費(fèi)級產(chǎn)品如果想讓企業(yè)持續(xù)使用,一定要解決企業(yè)的痛點問題,并且ROI是值得的?!靶枰越K為始思考,我們的產(chǎn)品有沒有能力給企業(yè)帶來價值,有沒有能力ROI為正?!边@幾年他們的產(chǎn)品思路也沿著規(guī)?;瘡?fù)制、細(xì)分行業(yè)的專業(yè)能力以及形象上高質(zhì)量、能表達(dá)可互動等角度發(fā)力。

行業(yè)內(nèi)都重視降低產(chǎn)品的使用門檻,不少廠商發(fā)布產(chǎn)品時都提到了通過極小樣本素材,實現(xiàn)數(shù)字人一鍵生成。在電商場景里,許多企業(yè)為了降低品牌客戶使用數(shù)字人的門檻,還提供了數(shù)字人代運(yùn)營模式。這一模式下,技術(shù)和服務(wù)一體,企業(yè)可以把數(shù)字人相關(guān)的工作整體交由機(jī)構(gòu)負(fù)責(zé),不用自己剪輯視頻,也不用自己去操作數(shù)字人后臺,按月支付軟件加服務(wù)費(fèi)用即可。

這種業(yè)態(tài)模式,數(shù)字人服務(wù)商的角色實際已經(jīng)與電商場景里的傳統(tǒng)MCN機(jī)構(gòu)和代運(yùn)營廠商的角色產(chǎn)生了重合。正如薇婭旗下公司提供數(shù)字人直播平臺和工具一樣,數(shù)字人廠商們的服務(wù)范圍也在延伸。觀察人士認(rèn)為,未來隨著數(shù)字人這類技術(shù)的規(guī)模化應(yīng)用和落地,在多個行業(yè)里,不同類型服務(wù)商角色邊界模糊和融合是大趨勢。

一些從業(yè)者認(rèn)為未來數(shù)字人將在許多企業(yè)服務(wù)場景里替代原有的白領(lǐng)角色,市場空間無限寬廣。不過也有人為,以直播帶貨為例,社交平臺在流量機(jī)制上不會讓所有的主播都由數(shù)字人代替,因此市場規(guī)模上會存在上限。

喧囂近半年后,從業(yè)者們也觀察到,市場已經(jīng)在呈現(xiàn)理性回歸狀態(tài)?!跋啾冗^去兩個月,一些喧囂和割韭菜類的角色在加速出清,市場熱度逐漸回到了年初狀態(tài)?!睒烦烁嬖V數(shù)智前線,長遠(yuǎn)看留下的會是更專注技術(shù)積累的公司。

業(yè)界共識是,賽道的周期挺長,當(dāng)下行業(yè)發(fā)展仍處于早期。盧言霞此前指出,“行業(yè)用戶一方面可以從相對成熟的應(yīng)用場景開始引入AI數(shù)字人;另一方面也需對應(yīng)用場景保持耐心,不設(shè)置過高的期望值?!?/p>

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

數(shù)字人,狂飆180天

市場火爆之下,企業(yè)們盯上的卻非同一塊蛋糕。

文|數(shù)智前線 徐鑫

編輯|任曉漁

大模型熱潮下,數(shù)字人賽道變得熱鬧起來。文旅、電商、金融等多個行業(yè),形形色色的虛擬數(shù)字人,正代替真人,扮演著代言人、主播、客服和智能助理的角色。

市場的參與者也肉眼可見變多?;ヂ?lián)網(wǎng)大廠、創(chuàng)業(yè)公司、老牌AI公司和一些此前做智能客服營銷的數(shù)字服務(wù)商都卷進(jìn)了這個賽道。IDC中國研究總監(jiān)盧言霞告訴數(shù)智前線,入口屬性是大量企業(yè)爭相布局這一賽道的原因。生成式AI熱潮下,數(shù)字人被視作未來使用自然語言與機(jī)器交互的入口級產(chǎn)品之一,推動了市場熱度提升。

2022年6月IDC在報告中預(yù)計,到2026年中國AI數(shù)字人市場規(guī)模將達(dá)到102.4億元人民幣。隨著熱度大增,數(shù)字人市場規(guī)??赡軐⒏爝_(dá)到這一水平。

值得一提的是,當(dāng)下仍處在大模型驅(qū)動數(shù)字人產(chǎn)品應(yīng)用落地的早期階段。一方面,業(yè)界認(rèn)為,數(shù)字人市場體量的變化要到明年有規(guī)?;涞睾蟛拍苷嬲谑袌龆擞兴w現(xiàn)?,F(xiàn)階段,技術(shù)成熟度、成本和效率等仍然是制約因素。另一方面,不同的廠商呈現(xiàn)出差異化競爭趨勢,企業(yè)正基于優(yōu)勢積累構(gòu)建自身的壁壘。

幾天前,GPT-4V版本更新,TTS(Text To Speech 文本轉(zhuǎn)語音技術(shù))進(jìn)步,文本驅(qū)動語音的表現(xiàn)在停頓、重音和交互自然程度上都有了極大提升。一些資深人士認(rèn)為,大模型驅(qū)動的數(shù)字人真正落地有望加速迎來爆發(fā)。

01 狂飆的數(shù)字人賽道

數(shù)字人賽道今年肉眼可見地火起來了。今年2月以來,“數(shù)字人”一詞的微信指數(shù)達(dá)到了去年十月的幾倍到幾十倍水平。

AI視頻直播SaaS創(chuàng)業(yè)公司特看科技CEO樂乘告訴數(shù)智前線,相比去年,今年整個賽道熱度明顯提升,前兩個月尤其明顯,呈現(xiàn)出泛濫乃至內(nèi)卷的狀態(tài)。

“去年就只有幾家在實驗,有點飄在半空中,主要是元宇宙、3D數(shù)字人方向,整體成本很高,很難商業(yè)化落地。今年一下子掉到地上來了?!?/p>

市場火爆下,也出現(xiàn)了一些亂象,有微商代理入場掘金。業(yè)內(nèi)人士統(tǒng)計,市面上大概有一千多家代理商在賣各種數(shù)字人。

大廠、創(chuàng)業(yè)團(tuán)隊、AI公司和一些此前做智能客服營銷的數(shù)字化服務(wù)商都在這一賽道頻繁動作。

大廠的布局其實早已有之。騰訊、百度、阿里、京東、火山引擎等平臺此前在元宇宙概念下或基于直播帶貨等多個場景,都推出過數(shù)字人產(chǎn)品平臺或服務(wù)。例如,騰訊云小微在2021年11月發(fā)布了數(shù)智人產(chǎn)品矩陣,提供3D超寫實、2D真人、2D卡通等五種風(fēng)格數(shù)智人產(chǎn)品。百度也在2021年AI開發(fā)者大會上發(fā)布了百度智能云曦靈平臺,具有數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)等功能,百度還打造出了“度曉曉”等數(shù)字人IP。

大模型到來后,廠商們推出新的數(shù)字人平臺,相比上一階段,制作效率和成本管理能力有大幅提升。騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊介紹,4月騰訊云發(fā)布的小樣本數(shù)智人生產(chǎn)平臺,12小時就能夠出來Demo,成本也大幅降至千元級別。快手在今年8月發(fā)布的AIGC數(shù)字人產(chǎn)品快手智播,產(chǎn)品功能主打的也是降低制作門檻,3~5分鐘真人視頻和音頻素材,成本實現(xiàn)大幅降低。

知名的AI公司們緊鑼密鼓秀出了肌肉。今年4月,商湯科技在其技術(shù)交流日上展示了2D數(shù)字人視頻生成平臺“如影SenseAvatar”,官方介紹,僅需一段5分鐘的真人視頻素材,就可以生成出聲音及動作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身。7月世界人工智能大會上,如影升級到2.0版本,重點提升數(shù)字人在多語種的語音和口型的流暢度。

一些在數(shù)字人賽道投入已久的公司也積極推新。8月中旬,在3D虛擬人賽道投入已有5年的技術(shù)服務(wù)商魔琺科技一口氣出了視頻AIGC生成平臺、AIGC直播平臺和虛擬人服務(wù)AIGC平臺三款消費(fèi)級產(chǎn)品,從高質(zhì)量、低成本和規(guī)模化復(fù)制三個層面,降低3D虛擬人的應(yīng)用落地門檻。

熱潮還吸引了跨界玩家,典型的有薇婭旗下的直播MCN機(jī)構(gòu)謙尋控股布局。8月8日,謙尋控股旗下子公司謙語智能和羚客分別發(fā)布了AI數(shù)字人直播解決方案和一站式AI智能直播綜合服務(wù)平臺。

資深人士認(rèn)為,入口屬性是大量企業(yè)爭相布局這一賽道的原因?!吧墒紸I,未來的入口之一是數(shù)字人。今天用的是簡單web版,未來數(shù)字人可能體驗更豐富。也是這個原因,企業(yè)開始紛紛進(jìn)入這一市場?!北R言霞告訴數(shù)智前線。

魔琺科技創(chuàng)始人柴金祥在8月中旬的消費(fèi)級產(chǎn)品發(fā)布會上則把3D虛擬人視作未來的一種基礎(chǔ)設(shè)施。“像網(wǎng)頁和APP一樣,作為一種內(nèi)容載體的升級,未來會重塑所有的行業(yè)”,柴金祥說。在這個認(rèn)知下,魔琺科技除了消費(fèi)級產(chǎn)品,還研發(fā)了3D虛擬人OS,用于管理未來的基礎(chǔ)設(shè)施。

嘗試將數(shù)字人形象和智能客服的對話能力結(jié)合的智能外呼公司云蝠智能看重的則是數(shù)字人的可互動性和未來的潛力。“最近有個表達(dá)我特別認(rèn)同,數(shù)字人其實就是大模型的 UI”,云蝠智能CEO魏佳星告訴數(shù)智前線,“把時間都拉到5~10年看,數(shù)字人可能是在創(chuàng)造硅基生命。今天只是可互動的數(shù)字人,沒有靈魂,并不代表未來它鉆不進(jìn)去靈魂?!?/p>

總體而言,大模型熱潮正在點燃數(shù)字人賽道。中航證券的一份報告指出,乘風(fēng)AI大模型的涌現(xiàn),虛擬數(shù)字人將加速釋放多元商業(yè)價值。數(shù)字人制造和運(yùn)營服務(wù)的B端市場不斷擴(kuò)大,將面向更廣大的C端用戶提供服務(wù),深耕數(shù)字人相關(guān)業(yè)務(wù)的企業(yè)有望迎來黃金發(fā)展期。

02 差異場景,各顯神通

市場火爆之下,企業(yè)們盯上的卻非同一塊蛋糕。

文旅、電商、金融和企業(yè)內(nèi)應(yīng)用等不同細(xì)分市場里,數(shù)字人的商業(yè)化前景也并不一致,樂乘認(rèn)為未來數(shù)字人更應(yīng)視作是一種能力,不同細(xì)分賽道對數(shù)字人專業(yè)能力要求也不同。

文旅行業(yè)數(shù)字人應(yīng)用不是新鮮事。數(shù)字人已經(jīng)在不少景區(qū)和文化機(jī)構(gòu),扮演了代言人或景區(qū)智能大屏里的智能導(dǎo)游角色。典型案例有以“敦煌飛天”為藍(lán)本打造的虛擬數(shù)字人“天妤”、中國文物交流中心的“文夭夭”、敦煌研究院的“伽瑤”、國家博物館的“艾雯雯”等。一家文旅公司提及,有了數(shù)字人后,一些歷史人物與游客個性化互動交流,展廳效果更豐富。

目前,百度、騰訊等不少廠商都在發(fā)力這一市場。幾個月前,一名百度的數(shù)字化服務(wù)商告訴數(shù)智前線,他們做了一個河北的項目,打的是文旅市場,千萬元級別。不過,也有行業(yè)人士提到,景區(qū)數(shù)字人并非單獨報價千萬,通常是整一套景區(qū)數(shù)字化解決方案中的一個能力,項目整體才能到千萬級別。總體而言,相比一些企業(yè)內(nèi)服務(wù)場景里千元級別的應(yīng)用,文旅場景稱得上頭部市場。

IDC介紹,金融行業(yè)是當(dāng)下數(shù)字人應(yīng)用相對更成熟的領(lǐng)域。以銀行業(yè)為例,國內(nèi)最早“聘用”數(shù)字員工的是浦發(fā)銀行,3D數(shù)字人“小浦”在2019年由浦發(fā)銀行聯(lián)手百度智能云打造。據(jù)介紹,目前“小浦”已經(jīng)在20多個崗位任職,包括財富規(guī)劃師、文檔審核員、大堂經(jīng)理、電話客服等。9月初,IDC中國副總裁兼首席分析師武連峰在外灘大會銀行業(yè)數(shù)字化論壇發(fā)布《銀行數(shù)字科技五大趨勢》時提到,到2025年,超過80%的銀行都將部署數(shù)字人,承擔(dān)90%的客服和理財咨詢服務(wù)。

一位城商行財富管理版塊的IT負(fù)責(zé)人告訴數(shù)智前線,他們也打算采購部署一套數(shù)字人,當(dāng)下正處于緊鑼密鼓考察其他銀行的數(shù)字人方案及不同廠商產(chǎn)品等階段。“基層員工有非常多指標(biāo),騰不出手來做更重要的工作”,該人士介紹,數(shù)字人可把他們從繁重的客服接待等工作中解放出來,去做更重要的客戶維護(hù)等運(yùn)維類工作。目前火山引擎、商湯科技、騰訊云、百度智能云、京東云等多家廠商都在金融行業(yè)里有數(shù)字人落地應(yīng)用案例。

電商直播場景里,不少頭部品牌已經(jīng)開始在嘗試數(shù)字人直播方案。樂乘介紹,大品牌樂于積極嘗試數(shù)字人與企業(yè)一把手的AI戰(zhàn)略有關(guān),高層提了擁抱AI后,中層就會在營銷等場景嘗試數(shù)字人工具。目前他們已經(jīng)服務(wù)了寶潔、歐萊雅等多個KA品牌,數(shù)據(jù)表現(xiàn)看數(shù)字人主播已經(jīng)達(dá)到了真人主播銷售額的70%。

數(shù)智前線了解到,電商直播場景里數(shù)字人服務(wù)模式有兩種:一種是給KA品牌提供了數(shù)字人直播軟件和代運(yùn)營的打包服務(wù),通常這個模式下每月報價在兩到三萬之間。另外一種是買一套軟件自己播,市場報價目前在兩千到四千之間。

看中直播市場的廠商不少,也出現(xiàn)了產(chǎn)品方案良莠不齊的現(xiàn)象,其中不乏“割韭菜”行為。一位電商行業(yè)資深人士介紹,目前使用數(shù)字人后數(shù)據(jù)好的品牌普遍特征是貨品本身有產(chǎn)品力,傳統(tǒng)無人直播方法也能賣得不錯,用了數(shù)字人之后效果再往上提升了幾成。

“那些吹噓數(shù)字人賣貨多么牛逼的數(shù)字人廠商,都是割韭菜,吹的越猛,鐮刀越鋒利?!痹撊耸空J(rèn)為,數(shù)字人當(dāng)下只是可以低成本規(guī)?;颜嫒四苜u好的貨能自動化完成銷售。

IDC指出,目前各類玩家的產(chǎn)品和解決方案在應(yīng)用方向上存在差異,企業(yè)都基于自身優(yōu)勢賽道來打造數(shù)字人的場景。大廠會有一定的優(yōu)勢,但小廠可以擇賽道而行,差異化競爭。

魏佳星告訴數(shù)智前線,他們切入數(shù)字人賽道,就選了一些又苦又累的場景。比如官網(wǎng)的客服用數(shù)字人又垂直又累,客單價還不高。普通的官網(wǎng)客服一般一年費(fèi)用在2000元,加一個數(shù)字人能力,價格可能不超過五千元。這是巨頭看不上的市場,一般的創(chuàng)業(yè)公司現(xiàn)在開始做,能力又追不上。這種差異化競爭是他們這類創(chuàng)業(yè)公司的機(jī)會。

03 規(guī)?;涞厍耙?/h4>

雖然聲量不小,動作頻頻,不過業(yè)內(nèi)普遍認(rèn)識到當(dāng)下仍然存在的挑戰(zhàn)。

盧言霞觀察,當(dāng)下大模型應(yīng)用尚未規(guī)?;涞?,要到明年才能在市場端有數(shù)據(jù)變動。目前階段,數(shù)字人開發(fā)周期,開發(fā)成本,形象定制,真正的AIGC化,都是挑戰(zhàn)。

以技術(shù)成熟度為例,不少數(shù)字人產(chǎn)品在語音、表情、互動表現(xiàn)上目前還比較生硬。一些資深人士甚至認(rèn)為,不成熟的解決方案甚至?xí)褲撛诘目蛻粲脩粝闯隽耸袌觥?/p>

不過這波AIGC浪潮下,技術(shù)更迭速度也很快。樂乘告訴數(shù)智前線,他們看到此前大模型跟數(shù)字人結(jié)合在文本轉(zhuǎn)語音技術(shù)(TTS)有突破的跡象?!爸拔谋咀兂蓴?shù)字人的自然度有問題,銜接上一直不太容易。大模型是一條線,數(shù)字人是一條線。他們需要TTS技術(shù)突破,才能實現(xiàn)很好的融合?!?/p>

9月底,OpenAI新發(fā)布了版本更新 GPT-4V中,TTS技術(shù)由一個全新的TTS模型提供支持。它能夠僅從文本和幾秒鐘的樣本語音中生成類似人類的音頻,結(jié)合Whisper模型的語音轉(zhuǎn)文本,保證用戶與ChatGPT進(jìn)行語音交流的質(zhì)量和流暢度。

行業(yè)人士觀察,在一些用戶已經(jīng)灰度測試的新版本里,文本轉(zhuǎn)語音表現(xiàn)頗令人驚艷,AI在停頓、語氣和抑揚(yáng)頓挫感上已經(jīng)非常接近真人?!拔遗袛郥TS技術(shù)端到端成熟后,對行業(yè)格局的改變會很大?!睒烦苏f,相當(dāng)于有了一個膠水,大模型驅(qū)動數(shù)字人從兩條線能夠結(jié)合到一起,企業(yè)后面去優(yōu)化數(shù)字人的表現(xiàn)力就可以了。

數(shù)字人產(chǎn)品的價值呈現(xiàn)及規(guī)?;瘡?fù)制能力也是業(yè)界關(guān)注的重點。

魔琺科技創(chuàng)始人柴金祥介紹,早期的虛擬人行業(yè)發(fā)展的一大痛點就是規(guī)模化復(fù)制問題。從長內(nèi)容時代的動畫、電影和游戲領(lǐng)域里的虛擬人到短內(nèi)容時代的虛擬偶像,例如初音未來、柳夜熙等,也包括魔琺早期打造的虛擬偶像翎__Ling都是手工制作,周期長,成本高。

一位觀察者提到,此前的頂流虛擬人偶像“柳夜熙”需要配備超百人的創(chuàng)意團(tuán)隊,制作一個作品的投入成本可能超過百萬級別。

柴金祥接受數(shù)智前線采訪時提到,魔琺的AIGC技術(shù)已突破內(nèi)容行業(yè)虛擬人此前無法被規(guī)?;瘡?fù)制的問題。此外,消費(fèi)級產(chǎn)品如果想讓企業(yè)持續(xù)使用,一定要解決企業(yè)的痛點問題,并且ROI是值得的?!靶枰越K為始思考,我們的產(chǎn)品有沒有能力給企業(yè)帶來價值,有沒有能力ROI為正?!边@幾年他們的產(chǎn)品思路也沿著規(guī)模化復(fù)制、細(xì)分行業(yè)的專業(yè)能力以及形象上高質(zhì)量、能表達(dá)可互動等角度發(fā)力。

行業(yè)內(nèi)都重視降低產(chǎn)品的使用門檻,不少廠商發(fā)布產(chǎn)品時都提到了通過極小樣本素材,實現(xiàn)數(shù)字人一鍵生成。在電商場景里,許多企業(yè)為了降低品牌客戶使用數(shù)字人的門檻,還提供了數(shù)字人代運(yùn)營模式。這一模式下,技術(shù)和服務(wù)一體,企業(yè)可以把數(shù)字人相關(guān)的工作整體交由機(jī)構(gòu)負(fù)責(zé),不用自己剪輯視頻,也不用自己去操作數(shù)字人后臺,按月支付軟件加服務(wù)費(fèi)用即可。

這種業(yè)態(tài)模式,數(shù)字人服務(wù)商的角色實際已經(jīng)與電商場景里的傳統(tǒng)MCN機(jī)構(gòu)和代運(yùn)營廠商的角色產(chǎn)生了重合。正如薇婭旗下公司提供數(shù)字人直播平臺和工具一樣,數(shù)字人廠商們的服務(wù)范圍也在延伸。觀察人士認(rèn)為,未來隨著數(shù)字人這類技術(shù)的規(guī)?;瘧?yīng)用和落地,在多個行業(yè)里,不同類型服務(wù)商角色邊界模糊和融合是大趨勢。

一些從業(yè)者認(rèn)為未來數(shù)字人將在許多企業(yè)服務(wù)場景里替代原有的白領(lǐng)角色,市場空間無限寬廣。不過也有人為,以直播帶貨為例,社交平臺在流量機(jī)制上不會讓所有的主播都由數(shù)字人代替,因此市場規(guī)模上會存在上限。

喧囂近半年后,從業(yè)者們也觀察到,市場已經(jīng)在呈現(xiàn)理性回歸狀態(tài)?!跋啾冗^去兩個月,一些喧囂和割韭菜類的角色在加速出清,市場熱度逐漸回到了年初狀態(tài)?!睒烦烁嬖V數(shù)智前線,長遠(yuǎn)看留下的會是更專注技術(shù)積累的公司。

業(yè)界共識是,賽道的周期挺長,當(dāng)下行業(yè)發(fā)展仍處于早期。盧言霞此前指出,“行業(yè)用戶一方面可以從相對成熟的應(yīng)用場景開始引入AI數(shù)字人;另一方面也需對應(yīng)用場景保持耐心,不設(shè)置過高的期望值?!?/p>

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。