正在閱讀:

做不出GPT,字節(jié)云“曲線救國 ”

掃一掃下載界面新聞APP

做不出GPT,字節(jié)云“曲線救國 ”

火山引擎的大模型訓練云野望。

文|科技新知   樟稻

編輯|伊頁

“大語言模型改變云計算游戲規(guī)則”,李彥宏的這則斷言,愈發(fā)成為云計算行業(yè)的共識。

可以從兩方面來解釋這種新變化。一方面,大語言模型在訓練和推理過程中需要大量的計算資源,即算力。而這些需求催生了云計算廠商為模型訓練提供更強大、更高效的計算資源。

作為佐證,投資機構(gòu)A16Z認為,生成式AI市場里的大量資金,其實最終流向了基礎設施公司。

A16Z估計,應用公司平均將約20%-40%的年收入,用于推理和定制化的微調(diào)。這部分通常直接支付給云服務提供商,以獲取實例或支付給第三方模型提供商,而后者將大約一半的收入投入于云基礎設施。據(jù)此有理由推測,生成式AI總營收的10%-20%將流向云服務提供商。

不僅如此,A16Z估算,許多擁有自家模型的初創(chuàng)公司已籌集到數(shù)十億美元的風險投資,其中大部分資金(在早期階段高達80%-90%),通常會支付給云服務提供商。這可是流向云廠商的“一大筆錢”。

另一方面,大語言模型的興起,讓許多復雜任務可以通過預訓練模型來解決。企業(yè)無需擁有龐大的技術團隊和資源,就能利用云計算服務快速實現(xiàn)AI應用。

簡單來說,模型即服務(Model as a Service,MaaS)將成為新的云計算服務形式。企業(yè)可以通過API調(diào)用預訓練模型來滿足自身業(yè)務需求,而這降低了云計算服務的使用門檻。

微軟是最典型的案例。眼下,Azure OpenAI服務已經(jīng)普遍可用,企業(yè)可以申請訪問包括GPT-3.5、Codex和DALL?E 2在內(nèi)的人工智能模型。目前,已經(jīng)使用Azure OpenAI的客戶有半導電視臺、畢馬威、RPA廠商Moveworks等等。

得益于上述新變化,國內(nèi)云計算行業(yè)迎來新的發(fā)展契機和活力,特別是在如今的低增長速度背景下,更加鼓舞人心。

此前,市場研究機構(gòu)IDC在2022年底的預測報告中,將中國云計算行業(yè)未來五年的平均增長速度下調(diào)了10%。這是考慮到互聯(lián)網(wǎng)行業(yè)整體增速放緩的影響,同時政企集成業(yè)務也在調(diào)整過程中。多方因素共同導致了互聯(lián)網(wǎng)云廠商普遍降低了業(yè)務預期。

從這個角度出發(fā),便能理解為何眾多云服務廠商,如此熱衷于成為國內(nèi)大模型熱潮中的舵手。

“賣鏟子”的火山引擎

 

前,大模型成為科技領域最熱門的話題。在中國,至少有數(shù)十家企業(yè)和機構(gòu)已經(jīng)發(fā)布了大模型產(chǎn)品或公布了相關計劃。作為互聯(lián)網(wǎng)領域的翹楚,字節(jié)跳動自然不會缺席這場AI競賽。

據(jù)《晚點LatePost》報道,面對ChatGPT和背后的大模型機會,張一鳴選擇親自跟進。一位字節(jié)人士稱,張一鳴近期時常會和一些字節(jié)人士分享論文學習心得和對ChatGPT的思考。

據(jù)了解,字節(jié)今年初才開始組建專門的大模型團隊,但一把手的跟進也意味著諸多資源傾斜。果不其然,近日,在BAT先后展示自己在大模型產(chǎn)品領域的進展后,字節(jié)終于亮出了自己手中“另類”的牌。

字節(jié)跳動旗下云服務平臺火山引擎舉辦的“原動力大會”上,火山引擎總裁譚待表示,火山引擎不做大模型,而是服務客戶做好大模型,為企業(yè)和消費者提供更豐富的AI應用。

進一步解讀,眼下國內(nèi)很多科技公司投入到大模型建設中,火山引擎要做的就是為大模型客戶提供高穩(wěn)定性和高性價比的AI基礎設施。

曾經(jīng)的北美淘金熱時期,尋找黃金的人們需要購買鏟子等必備工具,而出售這些商品的商人賺取了可觀的利潤。在現(xiàn)代商業(yè)環(huán)境中,“賣鏟子”這一說法常常用于形容為他人提供工具、服務或基礎設施的公司,而非直接參與某個行業(yè)的競爭?;鹕揭娲舜蜗胱龅谋闶窃诖竽P蜔岢敝小百u鏟子”。

后續(xù)的宣傳環(huán)節(jié)中,有兩個噱頭十分玩味。一是,火山引擎宣稱,中國的大模型領域,七成以上已是其客戶。面對媒體群訪,譚待解釋道,上述“七成”是火山引擎相關客戶與第三方機構(gòu)統(tǒng)計的大模型企業(yè)數(shù)量之比,能獲得這么多客戶是因為機器學習平臺解決了算力輔助的問題。

二是,為了讓更多潛在客戶安心,譚待在多個場合公開表示,火山引擎不做大模型。“我們不急于推出一個只有30分且只能適用于本地部署的大模型,這不是最關鍵的,核心是賦能其他人做這件事情?!?/p>

這幾乎是公然叫囂其他大模型參與者,特別是前不久剛剛放言“不用造輪子”的云廠商們。

拿阿里云來說,此前的云峰會上宣傳口徑是,阿里云希望幫助更多企業(yè)用上大模型,讓每家企業(yè)都能基于“通義千問”,擁有具備自己行業(yè)能力的專屬大模型。換句話說,在阿里巴巴提供的算力基礎設施、機器學習平臺以及大模型服務的支持下,企業(yè)們不再需要浪費時間和精力去“造輪子”,或是陷入針對大模型通用能力的無謂競爭。

百度也是同道中人。李彥宏認為自家三月發(fā)布的文心一言距離GPT的差距大概在兩個月,并且認為國內(nèi)大模型創(chuàng)業(yè)已經(jīng)基本沒有機會,大家也沒必要在大模型上重復造輪子。為此,還引發(fā)了王小川的揶揄。

在阿里、百度先后公布大模型策略后,火山引擎拿出更低的姿態(tài),顯然是在丟掉時機優(yōu)勢后,寄希望于彎道超車。畢竟,哪個創(chuàng)業(yè)者沒有成為中國OpenAI的夢呢?

字節(jié)云需要更多王小川

 

賣鏟子”商業(yè)模式的核心,是鼓吹更多淘金者加入。

歷史上,加州淘金熱期間,當?shù)貓蠹埌l(fā)表了關于在若干地點發(fā)現(xiàn)金子的文章,迅速引發(fā)了廣泛的關注。一些商人和企業(yè)便利用淘金熱來推廣他們的產(chǎn)品和服務。例如,郵輪公司和鐵路公司為了吸引更多的乘客,大肆宣傳推銷前往淘金地區(qū)的船票和車票。

放到此次大模型熱潮中,火山引擎想要靠“賣鏟子”發(fā)家致富,自然需要站在“王小川們”這一邊。

為此,火山引擎造了“多云多模態(tài)”這個概念。譚待表示,在大模型及下游應用發(fā)展推動下,無論傳統(tǒng)企業(yè)還是初創(chuàng)企業(yè),對AI算力都有迫切需求,企業(yè)使用多家云服務將成為常態(tài)。同時,各行業(yè)有自己高質(zhì)量的私有語料,大模型不會一家獨大,而是會在千行百業(yè)生長,形成多模型共生甚至協(xié)作的生態(tài)?!拔磥韺⑹恰嘣贫嗄P汀臅r代?!?/p>

對于該論斷,王慧文(美團聯(lián)合創(chuàng)始人)、賈揚清(原阿里技術副總裁)、周伯文(原京東高級副總裁)、李巖(快手前 MMU 負責人)、閆俊杰(原商湯科技副總裁)等創(chuàng)業(yè)者肯定贊同。

不過,這里也還有一些不確定因素。其一,王小川等創(chuàng)業(yè)者一定會用火山引擎賣的“鏟子”嗎?

簡單來說,火山引擎主要是為大模型客戶提供AI基礎設施,可以理解為AI算力需求。而對于算力需求,王小川并沒有直言通過云廠商來滿足。

此前在參訪中,王小川認為中國可以購買的英偉達A800和A100芯片性能差距只有5%,目前不會成為“卡脖子”的瓶頸,尤其對未來國產(chǎn)芯片有一定技術突破特別有信心。

簡單來說,對于王小川等創(chuàng)業(yè)者而言,是否“借道”云廠商們猶未可知。

其二,火山引擎是否會堅守不涉及大模型的立場?

據(jù)《晚點 LatePost》披露,目前參與字節(jié)大模型的技術負責人有朱文佳、項亮、李航等,他們分屬字節(jié)多個部門。其中項亮、李航向火山引擎BU負責人楊震原匯報。

對于要不要做大模型,楊震源曾回應稱字節(jié)跳動對大模型也在做一些學習和研究,現(xiàn)在還沒有什么結(jié)果,也沒有大模型產(chǎn)品落地時間表。從這里來看,火山引擎并沒有宣傳中那樣堅定路線。畢竟不做大模型,直接意味著云廠商少了模型及服務這條營收支線。

從這次整個宣傳動作來看,火山引擎延續(xù)了一直以來的策略。此前,作為云市場的后來者,火山引擎的目標是做阿里云、騰訊云、華為云之外的“第四朵云”。

對此,多云成為火山引擎反復強調(diào)的一個宣傳點。RightScale在2019年對全球企業(yè)用云策略的調(diào)查顯示,超過1000人的大型企業(yè)中,選擇多云部署的占比達到84%,其中混合云占比達到58%。這種多云策略,或是字節(jié)跳動擴大市場份額的轉(zhuǎn)機。

而這次,火山引擎在多云的基礎上還加上了多模態(tài)。

不過,根據(jù)IDC最近發(fā)布的《中國公有云服務市場(2022上半年)跟蹤報告》顯示,2022年上半年,阿里云、華為云、天翼云、騰訊云和AWS這五大云廠商一直占據(jù)了70%以上的市場份額。火山引擎仍然處于名不見經(jīng)傳的其他廠商(Others)之列。

顯然,在這個已經(jīng)相對成熟的云市場中,火山引擎想要突圍并不容易。后發(fā)者想要顛覆格局,天時地利人和缺一不可,大模型熱潮可以看作機會窗口打開,但結(jié)局到底如何還要取決于字節(jié)團隊的深耕細作。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

做不出GPT,字節(jié)云“曲線救國 ”

火山引擎的大模型訓練云野望。

文|科技新知   樟稻

編輯|伊頁

“大語言模型改變云計算游戲規(guī)則”,李彥宏的這則斷言,愈發(fā)成為云計算行業(yè)的共識。

可以從兩方面來解釋這種新變化。一方面,大語言模型在訓練和推理過程中需要大量的計算資源,即算力。而這些需求催生了云計算廠商為模型訓練提供更強大、更高效的計算資源。

作為佐證,投資機構(gòu)A16Z認為,生成式AI市場里的大量資金,其實最終流向了基礎設施公司。

A16Z估計,應用公司平均將約20%-40%的年收入,用于推理和定制化的微調(diào)。這部分通常直接支付給云服務提供商,以獲取實例或支付給第三方模型提供商,而后者將大約一半的收入投入于云基礎設施。據(jù)此有理由推測,生成式AI總營收的10%-20%將流向云服務提供商。

不僅如此,A16Z估算,許多擁有自家模型的初創(chuàng)公司已籌集到數(shù)十億美元的風險投資,其中大部分資金(在早期階段高達80%-90%),通常會支付給云服務提供商。這可是流向云廠商的“一大筆錢”。

另一方面,大語言模型的興起,讓許多復雜任務可以通過預訓練模型來解決。企業(yè)無需擁有龐大的技術團隊和資源,就能利用云計算服務快速實現(xiàn)AI應用。

簡單來說,模型即服務(Model as a Service,MaaS)將成為新的云計算服務形式。企業(yè)可以通過API調(diào)用預訓練模型來滿足自身業(yè)務需求,而這降低了云計算服務的使用門檻。

微軟是最典型的案例。眼下,Azure OpenAI服務已經(jīng)普遍可用,企業(yè)可以申請訪問包括GPT-3.5、Codex和DALL?E 2在內(nèi)的人工智能模型。目前,已經(jīng)使用Azure OpenAI的客戶有半導電視臺、畢馬威、RPA廠商Moveworks等等。

得益于上述新變化,國內(nèi)云計算行業(yè)迎來新的發(fā)展契機和活力,特別是在如今的低增長速度背景下,更加鼓舞人心。

此前,市場研究機構(gòu)IDC在2022年底的預測報告中,將中國云計算行業(yè)未來五年的平均增長速度下調(diào)了10%。這是考慮到互聯(lián)網(wǎng)行業(yè)整體增速放緩的影響,同時政企集成業(yè)務也在調(diào)整過程中。多方因素共同導致了互聯(lián)網(wǎng)云廠商普遍降低了業(yè)務預期。

從這個角度出發(fā),便能理解為何眾多云服務廠商,如此熱衷于成為國內(nèi)大模型熱潮中的舵手。

“賣鏟子”的火山引擎

 

前,大模型成為科技領域最熱門的話題。在中國,至少有數(shù)十家企業(yè)和機構(gòu)已經(jīng)發(fā)布了大模型產(chǎn)品或公布了相關計劃。作為互聯(lián)網(wǎng)領域的翹楚,字節(jié)跳動自然不會缺席這場AI競賽。

據(jù)《晚點LatePost》報道,面對ChatGPT和背后的大模型機會,張一鳴選擇親自跟進。一位字節(jié)人士稱,張一鳴近期時常會和一些字節(jié)人士分享論文學習心得和對ChatGPT的思考。

據(jù)了解,字節(jié)今年初才開始組建專門的大模型團隊,但一把手的跟進也意味著諸多資源傾斜。果不其然,近日,在BAT先后展示自己在大模型產(chǎn)品領域的進展后,字節(jié)終于亮出了自己手中“另類”的牌。

字節(jié)跳動旗下云服務平臺火山引擎舉辦的“原動力大會”上,火山引擎總裁譚待表示,火山引擎不做大模型,而是服務客戶做好大模型,為企業(yè)和消費者提供更豐富的AI應用。

進一步解讀,眼下國內(nèi)很多科技公司投入到大模型建設中,火山引擎要做的就是為大模型客戶提供高穩(wěn)定性和高性價比的AI基礎設施。

曾經(jīng)的北美淘金熱時期,尋找黃金的人們需要購買鏟子等必備工具,而出售這些商品的商人賺取了可觀的利潤。在現(xiàn)代商業(yè)環(huán)境中,“賣鏟子”這一說法常常用于形容為他人提供工具、服務或基礎設施的公司,而非直接參與某個行業(yè)的競爭。火山引擎此次想做的便是在大模型熱潮中“賣鏟子”。

后續(xù)的宣傳環(huán)節(jié)中,有兩個噱頭十分玩味。一是,火山引擎宣稱,中國的大模型領域,七成以上已是其客戶。面對媒體群訪,譚待解釋道,上述“七成”是火山引擎相關客戶與第三方機構(gòu)統(tǒng)計的大模型企業(yè)數(shù)量之比,能獲得這么多客戶是因為機器學習平臺解決了算力輔助的問題。

二是,為了讓更多潛在客戶安心,譚待在多個場合公開表示,火山引擎不做大模型?!拔覀儾患庇谕瞥鲆粋€只有30分且只能適用于本地部署的大模型,這不是最關鍵的,核心是賦能其他人做這件事情。”

這幾乎是公然叫囂其他大模型參與者,特別是前不久剛剛放言“不用造輪子”的云廠商們。

拿阿里云來說,此前的云峰會上宣傳口徑是,阿里云希望幫助更多企業(yè)用上大模型,讓每家企業(yè)都能基于“通義千問”,擁有具備自己行業(yè)能力的專屬大模型。換句話說,在阿里巴巴提供的算力基礎設施、機器學習平臺以及大模型服務的支持下,企業(yè)們不再需要浪費時間和精力去“造輪子”,或是陷入針對大模型通用能力的無謂競爭。

百度也是同道中人。李彥宏認為自家三月發(fā)布的文心一言距離GPT的差距大概在兩個月,并且認為國內(nèi)大模型創(chuàng)業(yè)已經(jīng)基本沒有機會,大家也沒必要在大模型上重復造輪子。為此,還引發(fā)了王小川的揶揄。

在阿里、百度先后公布大模型策略后,火山引擎拿出更低的姿態(tài),顯然是在丟掉時機優(yōu)勢后,寄希望于彎道超車。畢竟,哪個創(chuàng)業(yè)者沒有成為中國OpenAI的夢呢?

字節(jié)云需要更多王小川

 

賣鏟子”商業(yè)模式的核心,是鼓吹更多淘金者加入。

歷史上,加州淘金熱期間,當?shù)貓蠹埌l(fā)表了關于在若干地點發(fā)現(xiàn)金子的文章,迅速引發(fā)了廣泛的關注。一些商人和企業(yè)便利用淘金熱來推廣他們的產(chǎn)品和服務。例如,郵輪公司和鐵路公司為了吸引更多的乘客,大肆宣傳推銷前往淘金地區(qū)的船票和車票。

放到此次大模型熱潮中,火山引擎想要靠“賣鏟子”發(fā)家致富,自然需要站在“王小川們”這一邊。

為此,火山引擎造了“多云多模態(tài)”這個概念。譚待表示,在大模型及下游應用發(fā)展推動下,無論傳統(tǒng)企業(yè)還是初創(chuàng)企業(yè),對AI算力都有迫切需求,企業(yè)使用多家云服務將成為常態(tài)。同時,各行業(yè)有自己高質(zhì)量的私有語料,大模型不會一家獨大,而是會在千行百業(yè)生長,形成多模型共生甚至協(xié)作的生態(tài)?!拔磥韺⑹恰嘣贫嗄P汀臅r代?!?/p>

對于該論斷,王慧文(美團聯(lián)合創(chuàng)始人)、賈揚清(原阿里技術副總裁)、周伯文(原京東高級副總裁)、李巖(快手前 MMU 負責人)、閆俊杰(原商湯科技副總裁)等創(chuàng)業(yè)者肯定贊同。

不過,這里也還有一些不確定因素。其一,王小川等創(chuàng)業(yè)者一定會用火山引擎賣的“鏟子”嗎?

簡單來說,火山引擎主要是為大模型客戶提供AI基礎設施,可以理解為AI算力需求。而對于算力需求,王小川并沒有直言通過云廠商來滿足。

此前在參訪中,王小川認為中國可以購買的英偉達A800和A100芯片性能差距只有5%,目前不會成為“卡脖子”的瓶頸,尤其對未來國產(chǎn)芯片有一定技術突破特別有信心。

簡單來說,對于王小川等創(chuàng)業(yè)者而言,是否“借道”云廠商們猶未可知。

其二,火山引擎是否會堅守不涉及大模型的立場?

據(jù)《晚點 LatePost》披露,目前參與字節(jié)大模型的技術負責人有朱文佳、項亮、李航等,他們分屬字節(jié)多個部門。其中項亮、李航向火山引擎BU負責人楊震原匯報。

對于要不要做大模型,楊震源曾回應稱字節(jié)跳動對大模型也在做一些學習和研究,現(xiàn)在還沒有什么結(jié)果,也沒有大模型產(chǎn)品落地時間表。從這里來看,火山引擎并沒有宣傳中那樣堅定路線。畢竟不做大模型,直接意味著云廠商少了模型及服務這條營收支線。

從這次整個宣傳動作來看,火山引擎延續(xù)了一直以來的策略。此前,作為云市場的后來者,火山引擎的目標是做阿里云、騰訊云、華為云之外的“第四朵云”。

對此,多云成為火山引擎反復強調(diào)的一個宣傳點。RightScale在2019年對全球企業(yè)用云策略的調(diào)查顯示,超過1000人的大型企業(yè)中,選擇多云部署的占比達到84%,其中混合云占比達到58%。這種多云策略,或是字節(jié)跳動擴大市場份額的轉(zhuǎn)機。

而這次,火山引擎在多云的基礎上還加上了多模態(tài)。

不過,根據(jù)IDC最近發(fā)布的《中國公有云服務市場(2022上半年)跟蹤報告》顯示,2022年上半年,阿里云、華為云、天翼云、騰訊云和AWS這五大云廠商一直占據(jù)了70%以上的市場份額?;鹕揭嫒匀惶幱诿灰娊?jīng)傳的其他廠商(Others)之列。

顯然,在這個已經(jīng)相對成熟的云市場中,火山引擎想要突圍并不容易。后發(fā)者想要顛覆格局,天時地利人和缺一不可,大模型熱潮可以看作機會窗口打開,但結(jié)局到底如何還要取決于字節(jié)團隊的深耕細作。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。