文|零態(tài)LT 張堯
編輯|胡展嘉
618的風(fēng)刮到了大模型圈。僅僅一周,大模型從“厘”時代跨入了“免費”時代。
據(jù)統(tǒng)計,此次降價潮共涉及21款大模型廠家。從手機大戰(zhàn)、網(wǎng)約車大戰(zhàn)、共享單車大戰(zhàn)、社區(qū)團購大戰(zhàn),再到后來的造車大戰(zhàn)和如今的大模型大戰(zhàn)。熱鬧的大模型降價潮是否能再次“便宜”消費者?中小企業(yè)、云廠商、大模型廠家,誰才是真正的贏家?
而隨著降價潮帶來的推理成本的降低,大模型商業(yè)化的進程也許加速C端應(yīng)用的爆發(fā)。
01 大模型有免費午餐嗎?
誰也沒想到,大模型降價潮的多米諾首先被一家小公司推開了。
5月6日,幻方旗下DeepSeek發(fā)布的DeepSeek-V2,其價格為GPT-4-Turbo的近百分之一。5月11日,智譜AI大模型開放平臺也將入門級產(chǎn)品GLM-3 Turbo模型調(diào)用價格下調(diào)80%。
國內(nèi)大模型廠商價格戰(zhàn)隨即開啟。5月15日,在春季火山引擎Force原動力大會上,字節(jié)主力模型在企業(yè)市場定價只有0.0008元/千Tokens,比行業(yè)價格低99.3%,讓大模型從“以分計價”進入到“以厘計價”階段。
其他大廠紛紛跟進,5月21日,阿里云宣布將旗下通義千問的多款商業(yè)化及開源模型進行大幅降價,其中對標(biāo)GPT-4的商業(yè)化模型Qwen-Long的API輸入價格從0.02元/千Tokens降至0.0005元/千Tokens,下降97%;輸出價格從0.02元/千Tokens降至0.002元/千Tokens,下降90%。同時,百度智能云也發(fā)布公告稱,百度文心大模型的兩款主力模型ENIRESpeed、ENIRElite將全面免費,并立即生效。
騰訊、科大訊飛等廠商也宣布降價??拼笥嶏w宣布訊飛星火API能力正式免費開放,訊飛星火Lite API永久免費開放,頂配版(Spark3.5 Max)API價格為0.21元/萬Tokens。
又是降價,又是免費,“虧本買賣”的廠商們是要把大模型推向免費時代嗎?
仔細(xì)分析下,率先降價的豆包大模型只是降低輸入價格,輸出價格降幅并不明顯。阿里云降低了輸入和輸出價格,但Qwen-Max的輸出價格并沒有降低,這是千問系列當(dāng)中參數(shù)規(guī)模最大、成本最高的模型,百度降低了也是兩款參數(shù)規(guī)模較小的模型,文心4.0并不在此次降價范疇。大幅降價的都是小規(guī)模模型,雖然對外聲稱水平可以對標(biāo)GPT-4,但實際上連GPT-3.5都不如,模型水平不達標(biāo),根本無法在實際的生產(chǎn)環(huán)境中運行。
降價的誠意讓人懷疑,看上去像拿幾個不好吃的小菜出來,還聲稱可以免費吃飯。難怪網(wǎng)友懷疑,大模型企業(yè)把開發(fā)者和企業(yè)吸引過來使用,也許就要開始卡調(diào)用速度、推理速度、任務(wù)處理量等關(guān)鍵指標(biāo)了?!氨颇阕兂蓈ip,再逼你成為svip”的套路很讓人熟悉。
02 降價只是簡單的市場策略
目前,AIGC產(chǎn)業(yè)的商業(yè)模式主要包括按調(diào)用量收費、SaaS(Software as a Service)訂閱收費、增值服務(wù)和解決方案等多種形式,覆蓋了從內(nèi)容生產(chǎn)公司到普通消費者的廣泛客戶群體。
以O(shè)penAI為例,其主要收入來源有三:一是針對C端的會員收取訂閱服務(wù)費用;二是為企業(yè)端開發(fā)者提供API調(diào)用服務(wù),通過付費接入OpenAI端口后,B端用戶可在金融、醫(yī)療、繪畫等領(lǐng)域調(diào)用GPT系列大模型、DALL·E系列文生圖模型、Whisper語音識別模型進行應(yīng)用開發(fā),這也是OpenAI最核心的業(yè)務(wù);三是來自微軟Azure云服務(wù)的分成。憑借這三項主要業(yè)務(wù),2023年OpenAI收入突破了13億元。
由于處于相同的賽道,目前國內(nèi)大廠的收費模式也基本類似于OpenAI,但無論是C端還是B端,國內(nèi)大模型發(fā)展的瓶頸早已是現(xiàn)實。大模型推理價格的降低,主要是因為各個廠商為了搶占市場份額、加速商業(yè)化進程。
一個現(xiàn)實是,國內(nèi)大模型的使用人數(shù)還是太少且用戶增長乏力,使用數(shù)據(jù)不夠豐富。其次,國內(nèi)大模型在應(yīng)用層面,即基于AIGC應(yīng)用端的用戶數(shù)量也不高。因此,通過免費擴大用戶規(guī)模,增加用戶交互和訓(xùn)練數(shù)據(jù)是這次價格戰(zhàn)的主要目標(biāo)。
市場普遍認(rèn)為,價格戰(zhàn)的本質(zhì)是國內(nèi)大模型技術(shù)差異不大,用戶難以感知技術(shù)上的區(qū)分?;ヂ?lián)網(wǎng)大廠通過雄厚的資金,快速削弱和踢出資金實力薄弱的公司。從當(dāng)年的手機大戰(zhàn)、網(wǎng)約車大戰(zhàn)、共享單車大戰(zhàn)、社區(qū)團購大戰(zhàn),再到后來的造車大戰(zhàn)都是相似的套路,背后都是技術(shù)差距過小導(dǎo)致的。
但大模型“價格戰(zhàn)”不只是簡單的市場競爭策略。不少人認(rèn)為,降價標(biāo)志著國產(chǎn)大模型發(fā)展的商業(yè)化拐點已到。申萬宏源研究所信息化研究部總監(jiān)、TMT行業(yè)首席分析師劉洋在公開采訪中表示,國內(nèi)大模型企業(yè)重視產(chǎn)業(yè)價值優(yōu)于財務(wù)價值,用戶端以及增值版本已經(jīng)到了可以大規(guī)模推廣的時候。科大訊飛在發(fā)布會中表示,當(dāng)前公司基于國產(chǎn)自主可控大模型工程化優(yōu)勢,訊飛星火API能力正式免費開放,有利于幫助開發(fā)者降低調(diào)用成本,驅(qū)動產(chǎn)品創(chuàng)新驗證,加速大模型賦能及AI普惠化的到來。
人類每一次技術(shù)進步的結(jié)果,就是技術(shù)成本的不斷降低,大模型同樣遵循著一種“摩爾定律”和規(guī)模效應(yīng)。OpenAI等國外公司早已率先實現(xiàn)了降價,模型能力和算力成本的雙重困境下的國內(nèi)大模型敢于降價,未嘗不是算力成本下降的結(jié)果。
對于堅持做大模型的云廠商來說,搶占市場份額之外,更大的算盤其實在公有云市場。
公有云是大模型的技術(shù)基礎(chǔ)。OpenAI發(fā)布4o大模型后,引起了社交媒體的一段鼓吹,但亦有專業(yè)人士指出,基于Transformer架構(gòu)下的ChatGpt如果一直依賴公有云,就必然要面對大量用戶使用時低延遲無法得到滿足的現(xiàn)實。
公共云在生成式人工智能時代神經(jīng)網(wǎng)絡(luò)和啟動機器般基石作用的體現(xiàn)。因此,大模型行業(yè)的快速發(fā)展,公有云仍然是巨大的獲利方。如果大模型應(yīng)用真正爆發(fā),AI推理市場也將迎來爆發(fā),打造了具有基座大模型能力的公共云廠商,通過公共云+API的模式,才能走出新的增長曲線,獲取更大的盈利空間。以阿里云為代表的云計算廠商,通過從底層算力、AI平臺再到模型服務(wù)的不斷創(chuàng)新,同時AI也反哺了云從管理、應(yīng)用、計算、基礎(chǔ)架構(gòu)能力的提升。
03 槍響之后,誰是贏家
像網(wǎng)約車大戰(zhàn)時用戶能極低價格打車一樣,每次價格大戰(zhàn)都是消費者再次收割紅利的時候,但不同的是,此次大模型的降價也許受益者并不是普通消費者。
一直以來,大模型面臨的尷尬是:用戶增長乏力不可避免,寫復(fù)雜的提示詞仍然是普通用戶最大的障礙。目前面向C端的主要是各手機廠商植入式的AI助手,但這些AI工具難以從消費者手中變現(xiàn)。
大模型降價究竟誰能得利?
透過AIGC 產(chǎn)業(yè)鏈中各層級關(guān)系來看,目前位于產(chǎn)業(yè)最底層的是基礎(chǔ)設(shè)施層,核心是支撐算力的AI服務(wù)器,如CPU、GPU等,這一產(chǎn)業(yè)領(lǐng)域以英偉達和AMD為代表;往上是需要諸多頂尖科學(xué)家進行長時期投入的模型層,國外的OpenAI和Google以及國內(nèi)大廠目前主要在這一領(lǐng)域競爭。基于大模型的應(yīng)用層,則是致力于解決C端用戶的消費終端以及為B端用戶提供行業(yè)解決方案。
對于大模型行業(yè)來說,僅僅具有技術(shù)的先進性并不能帶來應(yīng)用的落地,如果不能降低大模型的推理成本,任何商業(yè)化都將是一種昂貴的嘗試,尤其是C端應(yīng)用,成本可能是個無底洞。
由此可見,大模型全面降價最大的利好仍然是進行應(yīng)用開發(fā)的中小企業(yè),成本的降低有助于這一類企業(yè)的百花齊放。
以AI大模型為技術(shù)底座打造具有針對性的應(yīng)用軟件,最典型的就是今年首個爆火的國產(chǎn)生成式AI產(chǎn)品Remini。丑萌搞怪的黏土風(fēng)濾鏡,一躍讓Remini直接沖上了國內(nèi)iOS免費APP下載榜榜首。Remini的爆火讓人們想起了另一款圖像生成軟件妙鴨,僅用9.9元和20張日常照就可以生成自己的“數(shù)字分身”,效果堪比市場價數(shù)百元的藝術(shù)寫真。和妙鴨一樣,Remini的結(jié)局也許只是曇花一現(xiàn),和那些不溫不火的AI應(yīng)用產(chǎn)品一起,讓人不得不對生成式AI的商業(yè)化應(yīng)用路徑及其穩(wěn)定性擔(dān)憂。
所以API貴是限制應(yīng)用端發(fā)展的主要原因嗎?顯然不是。正如阿里巴巴原副總裁賈揚清所言,今天企業(yè)在使用AI時,并不是成本驅(qū)動的。企業(yè)如果搞不清怎樣才能產(chǎn)生業(yè)務(wù)價值,再便宜也不過是一種浪費。
360董事長兼CEO也公開表示了自己對當(dāng)下大模型產(chǎn)業(yè)的看法。他認(rèn)為,公用大模型到應(yīng)用大模型轉(zhuǎn)變才是行業(yè)正確的思路。針對C端用戶,需要找到用戶需求進行個性化定制;另一方面為企業(yè)定制專業(yè)的大模型并進行私有化部署?!拔磥淼钠髽I(yè)內(nèi)部應(yīng)該擁有多個垂直大模型,這樣的模型既要簡約又要便于使用,提高企業(yè)內(nèi)部效率?!崩?,最近國產(chǎn)自研的聚焦財稅領(lǐng)域的垂類大模型——BPai財稅大模型。
既要抓模型技術(shù),又要抓商業(yè)應(yīng)用,價格戰(zhàn)之后的路還很遠。
“便宜贏得不了商戰(zhàn),誰能落地獲得利潤才是笑到最后?!?/p>