界面新聞記者 | 陳振芳 伍洋宇
界面新聞編輯 | 文姝琪
每當工作遇到困難的時候,梁文峰總會想起量化投資先驅(qū)西蒙斯的話:“一定有辦法對價格建模。”梁文鋒是私募基金幻方量化的實際控制人。由他創(chuàng)立的大模型公司DeepSeek在業(yè)內(nèi)被稱為“價格屠夫”,是最近這一輪大模型價格戰(zhàn)的始作俑者。
2024年5月6日,DeepSeek發(fā)布DeepSeek-V2開源MoE模型,在市場毫無預見的情況下改變了大模型廠商格局。其API接口定價直接下探至每百萬tokens輸入1元、輸出2元(32K上下文),價格僅為GPT-4-Turbo的近百分之一。
不出半個月,智譜AI、字節(jié)跳動、阿里云、百度、騰訊云接連選擇跟進降價。其中,騰訊和百度直接免費了幾款大模型產(chǎn)品——正如梁文峰曾經(jīng)相信的那樣,由他發(fā)起的價格戰(zhàn)正在重塑整個大模型產(chǎn)業(yè)格局。
過去一年多的大模型狂熱推動英偉達市值一路暴漲。然而,除了提供GPU的英偉達賺到了錢,大模型廠商依然在大量燒錢。每一次模型訓練,用戶的每一次詢問,開發(fā)者的每一次調(diào)用,都對應(yīng)一份算力消耗,每次消耗都是一筆成本賬。
這使得突如其來的降價潮更加出乎旁觀者意料?!叭ツ旮鶯P匯報時,我們預測三年后才能達到現(xiàn)在的價格水平,沒想到不到一年就達到了。”一位硬科技投資人告訴界面新聞,降價肯定會促使AI應(yīng)用迸發(fā),只是這一天更早的到來了。
1
引領(lǐng)這輪降價潮的梁文峰被認為是一個“攪局者”。
2008年,他從浙江大學畢業(yè),并沒有走入如火如荼的互聯(lián)網(wǎng)創(chuàng)業(yè)。在外界無從得知的幾年,傳說他曾住在成都的出租屋,幾經(jīng)波折最終走上量化投資之路。多年后,由他主導建立的幻方量化成為突破千億大關(guān)的量化私募機構(gòu)。
投資和大模型有何關(guān)系?梁文峰就是兩條路上交匯的那一個點。不少AGI信仰者聲稱: “Scaling law”(規(guī)模法則)是通往AGI的必經(jīng)之路,即數(shù)據(jù)、算力、計算量越大,訓練的模型越“聰明”。 而量化投資者們相信大數(shù)定律,當樣本容量足夠大時,樣本均值將趨近于總體均值。
“DeepSeek創(chuàng)始人是理想主義者?!庇型顿Y人向界面新聞如此評價。梁文峰的理想主義“財大氣粗”,帶著一萬枚英偉達A100 GPU、在北京租賃近2000平方米場地,“深度求索DeepSeek”在2023年7月橫空出世,寓意“路漫漫其修遠兮,吾將上下而求索”。
萬卡不一定是DeepSeek的上限。有行業(yè)人士向界面新聞表示,這家公司或許已經(jīng)有超兩萬枚英偉達A100 GPU。除了互聯(lián)網(wǎng)巨頭,幾乎沒有創(chuàng)業(yè)公司有如此多算力儲備。
在DeepSeek率先挑起價格戰(zhàn)之后,“跟還是不跟?”成為行業(yè)里每個參與者必須面對的選擇題。
最先坐不住的是掌握大量企業(yè)客戶的智譜AI。這家公司率先將對標GPT3.5-Turb的入門級模型GLM-3 Turbo模型調(diào)用價格下調(diào)90%,由5元/百萬tokens調(diào)整為1元/百萬token。
隨之而來的則是從未缺席過任何一場行業(yè)價格戰(zhàn)的互聯(lián)網(wǎng)大廠們。
字節(jié)跳動直接將大模型從以分計價帶到以厘計價時代。旗下的豆包通用模型pro-32k版輸入價格降至0.0008元/千Tokens,為同規(guī)格模型的1/150。
阿里云旗下的通義千問GPT-4級主力模型宣布降價97%,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,旗下9款商業(yè)化及開源模型也紛紛降價。
戰(zhàn)況愈演愈烈。百度文心直接將ERNIE Speed、ERNIE Lite兩款免費。騰訊云隨后也宣布混元大模型全面降價,主力模型之一“混元-lite”從0.008元/千tokens調(diào)整為免費,API輸入輸出總長度也將從目前的4k升級到256k。
然而,降價接力賽在大廠之間如火如荼,但創(chuàng)業(yè)公司的身影卻鮮少出現(xiàn)。大部分備受關(guān)注的獨角獸們均不動聲色。
百川智能創(chuàng)始人王小川認為,這一輪大廠降價的實質(zhì)是云廠商進到新戰(zhàn)場,降價是大廠射程范圍內(nèi)的事。他勸創(chuàng)業(yè)公司別把這個商業(yè)模式作為業(yè)務(wù)重點,也別摻和進去。
零一萬物創(chuàng)始人李開復的表態(tài)更早,也更強硬。
在這輪降價潮襲來之前,李開復就提醒說,“不應(yīng)在行業(yè)內(nèi)按照ofo式的燒錢打法重蹈覆轍?!倍诖髲S降價的苗頭漸起后,他依然表達了不參戰(zhàn)的態(tài)度,“如果以后中國市場可能就是這么卷,大家寧可賠光通輸也不讓你贏,那我們就走外國市場?!?/p>
李開復堅持認為價格戰(zhàn)是一個“雙輸”的打法,創(chuàng)業(yè)公司如果認定自己的技術(shù)值得,就應(yīng)當堅持一個合適的價格,而絕不能靠貼錢、賠錢做生意。
2
大廠和創(chuàng)業(yè)公司面對降價潮態(tài)度不一的背后,是心態(tài)和資金儲備的全然不同。
創(chuàng)業(yè)公司的視角是更好理解的。當前仍在牌桌上且手握大把籌碼的大模型創(chuàng)業(yè)公司,大都認可研發(fā)和應(yīng)用的“雙輪驅(qū)動”理論,這意味著它們既要做模型,也要做產(chǎn)品。而模型要技術(shù)人才、萬卡集群,產(chǎn)品要投流買量、跑馬圈地,創(chuàng)業(yè)公司燒錢的日子還在后頭。
更重要的是,創(chuàng)業(yè)公司的野望在C端(個人用戶市場)而非B端(企業(yè)市場)?!皼]有一家大模型公司靠賣API活著?!币幻P(guān)注大模型行業(yè)的FA(財務(wù)顧問)對界面新聞記者表示。
但如果選擇不參戰(zhàn),創(chuàng)業(yè)公司也無法完全無動于衷,必須找到自己的應(yīng)對策略。
獵豹移動董事長兼CEO傅盛認為,這次大降價基本宣告了大模型創(chuàng)業(yè)公司必須尋找新的商業(yè)模式。降的最兇的都是有云服務(wù)的大公司,通過大模型來獲取云客戶,“羊毛出在豬身上,降得起”,而大模型創(chuàng)業(yè)公司沒有這樣的生態(tài),必須另尋商業(yè)模式。
除此以外,創(chuàng)業(yè)公司還需要警惕的是,自己是否會被可能出現(xiàn)的市場格局變動擠下牌桌。
活躍在投融資的FA和VC們告訴界面新聞,融到錢的創(chuàng)業(yè)公司其實已經(jīng)到了向投資人和市場“秀肌肉”的時刻。但技術(shù)進展的漫漫征程擺在眼前,燒錢也燒不過大廠,當商業(yè)化進展不夠順利,估值處于第二、第三梯隊的創(chuàng)業(yè)公司,會面臨融資壓力陡增的境地。
“今年很多大模型初創(chuàng)公司可能會出局,”前述FA表示,“市場上并不需要這么多家企業(yè)。”
而對資源儲備雄厚的大廠而言,降價的決策其實“早有預謀”。
在這波密集動作之前,它們幾乎已經(jīng)都在通過代金券、場景合作、工程優(yōu)化等各種方式,試圖降低模型利用的成本,當前的定價也是結(jié)合技術(shù)和用戶規(guī)模預期等綜合因素考量的結(jié)果。
“坦白說,誰的算力更充沛,誰就會有更大的收益。”上述FA人士表示。一個可證實的數(shù)字是,據(jù)DeepSeek內(nèi)部人士消息,該公司大模型服務(wù)在降價后的利潤率仍超50%。
“關(guān)鍵是什么時候降價?”這可能是過去一年所有云廠商都在琢磨的問題,直到DeepSeek作為導火索出現(xiàn)。
從技術(shù)上來說,大模型價格戰(zhàn)打得起來的根本原因在于,模型之間的差距不大。一位投資人直言,大廠之所以跟進,是因為在它們的視野中,DeepSeek所實現(xiàn)的架構(gòu)創(chuàng)新自己可以在短期內(nèi)達成,提前虧幾個月無所謂。
一位前互聯(lián)網(wǎng)云廠商從業(yè)人員告訴界面新聞,由于企業(yè)縮減預算,這兩年云市場的行情并不太好。另一方面,大模型還是沒有那么顛覆性,尤其國內(nèi)大模型還遠不如國外成熟。所以,以價格換市場成為自然而然的選擇。
多名受訪者認為,大廠降價的目的就是籠絡(luò)更多企業(yè)和開發(fā)者,為自己搭建生態(tài)護城河。
一名火山引擎內(nèi)部人士告訴界面新聞:“豆包大模型降價的真實原因在于,大模型在B端的應(yīng)用還沒有起來,場景太少?!彼赋觯m然行業(yè)在討論用AI大模型重構(gòu)業(yè)務(wù),但在日常工作生活里很少能感受到大模型能力的落地?!敖祪r本質(zhì)上是降低使用門檻?!?/p>
這個觀點在跟進降價的大廠中間是共識。大模型仍然處于市場培育階段,降價或免費都是為了讓更多企業(yè)和開發(fā)者能快速用上,并接入到自己的業(yè)務(wù)場景中。畢竟,讓更多人參與進來是行業(yè)發(fā)展的前提。
3
降價能不能最終帶來AI生態(tài)的繁榮?
AI應(yīng)用層的投資人對此持樂觀態(tài)度。楊泉在去年大模型公司融資勢頭最為火爆的時候,見過月之暗面創(chuàng)始人楊植麟,也見過王小川,但他所在的機構(gòu)最終沒有買下那張通用大模型的入場門票,而是轉(zhuǎn)向了AI應(yīng)用層。
“我跟朱嘯虎的觀點比較一致,所以我是樂于見到所謂降價潮的?!睏钊f,只有基礎(chǔ)設(shè)施的成本極低,在上面做應(yīng)用的公司才能迎來爆發(fā)。
過去移動互聯(lián)網(wǎng)的發(fā)展已經(jīng)證明了這一點。當運營商的網(wǎng)絡(luò)資費,云服務(wù)廠商的成本大幅下降之后,才逐漸長出了微信、抖音等等超級應(yīng)用。
而大模型領(lǐng)域也許能復制這一過程。當前在基礎(chǔ)大模型領(lǐng)域,中國公司的能力與OpenAI等美國引領(lǐng)者還有較大差距。多位投資人表示,中國彎道超車的機會在大模型應(yīng)用層。
一位美元基金硬科技投資人對中國的大模型發(fā)展更加樂觀:“中國不擅長于做顛覆性的創(chuàng)新,但特別適合做增量式創(chuàng)新,或者叫‘快速跟隨者’?!?/p>
他進一步指出,短期內(nèi),大模型領(lǐng)域的創(chuàng)新層出不窮,中美存在較大差距。但把時間拉軸拉長來看,創(chuàng)新斜率總會慢慢變平,當曲線當變平,中國就會有機會去反超,這是在電動車領(lǐng)域已經(jīng)發(fā)生的故事,“當特斯拉的技術(shù)創(chuàng)新放緩,中國電動車就追上來了。”
李飛飛團隊也提到,中國在全球AI專利申請方面占據(jù)主導地位,美國在AI模型的發(fā)展上保持領(lǐng)先。今年上半年,中國大模型創(chuàng)業(yè)公司和互聯(lián)網(wǎng)大廠對于模型更新和產(chǎn)品發(fā)布的節(jié)奏,在戰(zhàn)術(shù)上已有對于OpenAI的全面追趕之勢。
不過也有人持不同意見,作為一家大模型應(yīng)用初創(chuàng)公司的創(chuàng)始人,李靈昊沒有被這輪降價潮打動。在他的觀察中,更大參數(shù)、更大模型能力的高參量模型并沒降價或者降幅不多,主要是放開了一些低端的使用場景。
因此,從技術(shù)角度來說,他認為這輪降價并沒有為下游帶來太多變化。相較而言,他們更期待的是真正的技術(shù)變革。
李靈昊認為,但如果行業(yè)志在看到顛覆性的創(chuàng)新繁榮,大模型廠商們的最好做法,仍然是推進Scaling Law,真正從性能上讓下游開發(fā)者感受到何為如虎添翼。
大廠對此不是沒有認知。百度內(nèi)部人士告訴界面新聞:“長期來看,模型廠商最終競爭的還是模型本身的能力,只有把基礎(chǔ)模型效果做得足夠好,才能構(gòu)筑競爭壁壘。”
前述關(guān)注大模型行業(yè)的FA也指出,API價格戰(zhàn)不能代表什么,因為價格本身已經(jīng)足夠低了,它更多來源于技術(shù)架構(gòu)更新疊加市場劇烈競爭,“大家只是被迫卷,想先拉出身位差 ?!?/p>
不過,正如投資人所預言的那樣,降價難以影響模型性能升級,但有機會促使AI應(yīng)用的大迸發(fā)。
盡管王小川定義下的“超級應(yīng)用”只與“超級模型”深度綁定,正在降價的大模型API無法催促超級應(yīng)用的誕生。但在整個應(yīng)用生態(tài)中,當大模型時代的“電價”足夠普惠,垂直應(yīng)用生態(tài)有望進一步繁榮。
回看當下,降價潮并不會偃旗息鼓。前述FA判斷,“價格戰(zhàn)仍未觸底,硅基流動所引領(lǐng)的AI infra(AI 基礎(chǔ)軟件)還能將大模型的性能和價格再次‘擊穿’,只是還沒有對外發(fā)布?!薄獜倪@個角度而言,AI 2.0時代的“電力普及”或許才剛剛開始。
發(fā)起這場價格戰(zhàn)的DeepSeek已經(jīng)開始悄悄謀劃從幻方量化獨立出來,醞釀成為大模型賽場的大玩家。理論上,梁文峰彼時會手握量化交易、大模型兩張王牌。交易出身的他,曾無數(shù)次證明過一個普通道理,即價格可以重構(gòu)市場。
(應(yīng)受訪者要求,李靈昊、楊泉為化名)
(界面新聞記者肖芳、崔鵬對此文亦有貢獻)