正在閱讀:

英偉達(dá)凌晨打出了王炸,但已做不到通吃

掃一掃下載界面新聞APP

英偉達(dá)凌晨打出了王炸,但已做不到通吃

在大模型訓(xùn)練市場,英偉達(dá)一騎絕塵,但在推理市場,它不得不用CUDA去打擊對手。

文|數(shù)智前線 徐鑫 趙艷秋

編輯|石兆

2024GTC大會上,當(dāng)外界對英偉達(dá)B200的性能驚嘆不已時(shí),黃仁勛也展現(xiàn)了他在通用AGI時(shí)代的完整戰(zhàn)略和布局。

在硬件層,新一代Blackwell架構(gòu)和B200芯片產(chǎn)品,順應(yīng)了AI計(jì)算洶涌浪潮下對更大規(guī)模、更高效計(jì)算能力的需求。黃仁勛判斷,GPU的形態(tài)發(fā)生變化,規(guī)模更為龐大的,用萬億美元武裝的數(shù)據(jù)中心,將成為人工智能生成器。

在這些強(qiáng)大的數(shù)據(jù)中心中,新的算力將創(chuàng)造大量新的軟件。這些智能軟件,將呈現(xiàn)出新的分發(fā)模式,除了云端,也會打包成人們可攜帶的個人智能應(yīng)用。英偉達(dá)意在用NIM平臺,支持應(yīng)用廠商開發(fā)智能應(yīng)用,將NIM打造為CUDA生態(tài)之后的一個AI應(yīng)用級入口。

而由于智能可移動,未來所有移動的東西都將是機(jī)器人,它們需要數(shù)字孿生系統(tǒng)Omniverse,作為機(jī)器人世界的操作系統(tǒng)。英偉達(dá)的人形機(jī)器人基礎(chǔ)模型Project GR00T和 數(shù)字孿生系統(tǒng)Ominicerse API基于這一布局。

業(yè)界觀察到,英偉達(dá)的Blackwell架構(gòu)GPU產(chǎn)品,將進(jìn)一步拉大與業(yè)界其他芯片企業(yè)在大模型訓(xùn)練上的差距,這種差距甚至可能在幾十倍水平。不過在大模型推理芯片上,已有不少企業(yè)搶奪了英偉達(dá)的市場份額。

綜合這些因素,資本市場對英偉達(dá)的未來走向也產(chǎn)生了分歧,這支當(dāng)下最受歡迎的股票,正在分裂華爾街。

01、大模型訓(xùn)練算力,英偉達(dá)一騎絕塵

這場大會在圣何塞鯊魚隊(duì)的主場舉行,現(xiàn)場氣氛熱烈,有媒體形容這場盛會更像是一個體育賽事或搖滾音樂會。

最受矚目的,當(dāng)然是黃仁勛發(fā)布了新的GPU架構(gòu)Blackwell,并釋出了該架構(gòu)下的最新人工智能芯片B200。

Blackwell架構(gòu)以數(shù)學(xué)家戴維·布萊克韋爾(David Blackwell)來命名。這是英偉達(dá)推出的第七代GPU。2012年5月英偉達(dá)發(fā)布開普勒架構(gòu),推出了兩款k10和k20加速器,正式開啟了GPU時(shí)代。

黃仁勛在演講中將Blackwell與上一代架構(gòu)Hopper做了對比,稱Blackwell是新工業(yè)革命的引擎。新架構(gòu)下的B200包含2080億個晶體管,比H100的800億個晶體管多2.5倍。B200可提供高達(dá)20千兆次的 AI 計(jì)算性能,是H100的5倍。

Blackwell架構(gòu)下GPU性能的提升,使得可支撐訓(xùn)練的生成式AI大模型參數(shù)量級,擴(kuò)展10萬億參數(shù)。

“我們需要更大的GPU?!秉S仁勛說。過去8年時(shí)間里AI算力需求有了1000倍增長。在Blackwell架構(gòu)下,芯片之間可連接構(gòu)建出大型AI超算集群,支撐更大的計(jì)算需求。

比如兩個B200 GPU與Grace CPU結(jié)合,通過900GB/s的NVLink互連技術(shù),構(gòu)成GB200超級芯片。兩個超級芯片形成一個計(jì)算節(jié)點(diǎn),18個計(jì)算節(jié)點(diǎn)構(gòu)成計(jì)算單元GB200 NVL72。它們可通過持續(xù)擴(kuò)展,最終構(gòu)成包含32000 GPU的分布式超算集群——英偉達(dá)DGX AI超級計(jì)算機(jī)。

黃仁勛在演講中提到,GPU的形態(tài)已徹底改變,未來“英偉達(dá)DGX AI超級計(jì)算機(jī),就是AI工業(yè)革命的工廠”。

英偉達(dá)還提供一組數(shù)據(jù)稱,由兩片B200組成的GB200,在基于1750億參數(shù)的GPT-3基準(zhǔn)測試中,性能大約是H100的七倍,而且英偉達(dá)稱它提供了4倍的訓(xùn)練速度。GB200將于今年晚些時(shí)候上市,英偉達(dá)尚未公布該超級芯片的售價(jià)。

業(yè)界觀察到,隨著發(fā)布新核彈,英偉達(dá)的GPU產(chǎn)品在AI訓(xùn)練上的性能和水平,與全球其他玩家的差距在進(jìn)一步拉大,甚至出現(xiàn)幾十倍的差距。

02、推理市場,英偉達(dá)丟失不少份額

“雖然從大模型訓(xùn)練上,其他芯片廠商望塵莫及,但對于推理市場,國內(nèi)外的芯片企業(yè),還是搶了不少英偉達(dá)的市場份額?!币晃毁Y深人士告訴數(shù)智前線,僅國內(nèi)就有十幾家相關(guān)企業(yè),更不用說還有谷歌、亞馬遜等大企業(yè)。

推理追求的是“能效比”,比拼每瓦的計(jì)算性能。而今年大模型落地呈現(xiàn)一個爆發(fā)式增長,對推理的需求已經(jīng)很大了。

這也造成在兩周前,英偉達(dá)在CUDA11.6更新版本中,特意突出了一則警告:禁止其他硬件平臺上運(yùn)行基于CUDA的軟件。

“它打擊的就是AI加速芯片領(lǐng)域。英偉達(dá)想高低通吃,既要把持訓(xùn)練市場,又要圍獵推理市場?!鄙鲜鲑Y深人士說。

CUDA生態(tài),是英偉達(dá)花20年時(shí)間持續(xù)做的“基本功”。CUDA的價(jià)值,可以用Wintel聯(lián)盟為例,英特爾芯片每兩年升級一代,而Windows系統(tǒng)的完善,實(shí)際上是讓業(yè)界將系統(tǒng)之上的應(yīng)用用起來,比如辦公、互聯(lián)網(wǎng)。

英偉達(dá)一方面持續(xù)推出新GPU,另一方面,它的CUDA面向生命科學(xué)、量化、自動駕駛等場景在開發(fā)庫,讓應(yīng)用企業(yè)不用從零開始,直接去調(diào)用,很快就能完成一個藥物分子、自動駕駛的應(yīng)用?!八膮柡χ幨?,可能CUDA上已經(jīng)寫了10萬行代碼,對于應(yīng)用企業(yè)來說,它再寫幾百行、幾千行代碼,就解決問題了。”

“我們原來一直說的一個詞叫云原生,現(xiàn)在正在發(fā)生的是AI原生,但對于業(yè)界來說,毫不夸張的說,一直都有一個CUDA原生?!辟Y深人士感嘆,因?yàn)樵贑UDA上,很多應(yīng)用不需要從零開始,它們可以快速切入一個領(lǐng)域或者一個行業(yè)。

這就是英偉達(dá)長期的護(hù)城河。英偉達(dá)禁止其他硬件平臺上運(yùn)行CUDA,直接就造成兩個結(jié)果:一是在場景落地的時(shí)候,其他芯片廠商要付出的工作量會比較大;二是對于大多數(shù)芯片廠商來說,沒有了CUDA,變成了孤軍作戰(zhàn)。雖然它能滿足一個項(xiàng)目的需求,長期發(fā)展變得更不容易。類似CUDA軟件層面的投入非常巨大,有業(yè)內(nèi)人士認(rèn)為,毛利率在50%以下的企業(yè)“想都別想”,而追上生態(tài),估計(jì)可能需要5~10年。

最近幾年,有報(bào)道在介紹國外追趕英偉達(dá)的芯片創(chuàng)業(yè)公司,目前從市場反饋看,都沒有真正做起來。

03、一年漲五倍,后續(xù)走向分裂華爾街

GTC大會召開的預(yù)期下,昨晚英偉達(dá)的股價(jià)高開,盤中一度上漲超過4%,之后出現(xiàn)回落,收盤價(jià)僅上漲0.7%。不過,到盤后股價(jià)略微下挫,跌1.7%。

過去一年多,自O(shè)penAI的ChatGPT在2022年末開啟生成式人工智能的繁榮以來,英偉達(dá)在資本市場一路狂飆,股價(jià)上漲五倍多。

2023年1月時(shí),英偉達(dá)股價(jià)最低點(diǎn)僅為142美元,到今年3月,股價(jià)最高點(diǎn)一度到達(dá)926美元。一時(shí)風(fēng)頭無兩。去年12月底,英偉達(dá)在經(jīng)紀(jì)公司分析師最喜歡的股票排行榜上,名列榜首。

隨著股價(jià)暴漲,到本月英偉達(dá)的市值最高超過2.2萬億美元,成為了全球市值第三的公司,僅次于微軟和蘋果。

由于過去12個月英偉達(dá)股價(jià)一路飆升,一些人士判斷這只股票會遭遇調(diào)整期,這也使得一些分析師不再將英偉達(dá)列入買入評級,在最受歡迎的股票榜上,英偉達(dá)甚至不再進(jìn)入前20名。

不過在GTC大會召開前,一些分析師已經(jīng)上調(diào)了英偉達(dá)的目標(biāo)股價(jià)。例如,匯豐銀行(HSBC)分析師 Frank Lee 維持對 Nvidia 股票的買入評級,但將其目標(biāo)股價(jià)從此前的882美元上調(diào)至1,050美元。新的股價(jià)目標(biāo)比 Nvidia當(dāng)下的交易價(jià)高出18% 。

看好英偉達(dá)的人士堅(jiān)定認(rèn)為,市場對AI算力的強(qiáng)烈需求,當(dāng)下英偉達(dá)的不可取代性仍然非常明顯,仍將受益于洶涌的AGI浪潮。同時(shí)英偉達(dá)的新一代芯片產(chǎn)品的市場需求依然火爆,例如,英偉達(dá)CFO Colette Kress在今年2月的財(cái)報(bào)電話會議時(shí)預(yù)估,下一代產(chǎn)品的市場需求將超過供給,尤其是今年晚些時(shí)候發(fā)貨的新一代芯片B100依然供應(yīng)緊張。

而在給英偉達(dá)當(dāng)下的走向潑冷水的人里,最知名的當(dāng)屬人稱“木頭姐”的華爾街明星基金經(jīng)理、方舟投資管理公司的CEO凱茜·伍德(Cathie Wood)。她此前也大量持有英偉達(dá)股票,并斬獲頗豐。

今年2月她拋售了近450萬美元的英偉達(dá)股票,并指出市場對英偉達(dá)的期待過高,并且隨著競爭加劇和庫存的調(diào)整,英偉達(dá)未來業(yè)績有可能面臨挑戰(zhàn)。

更激進(jìn)的聲音則認(rèn)為英偉達(dá)存在泡沫。例如有投資界人士提到,投資者應(yīng)該仔細(xì)英偉達(dá)的這波AI需求驅(qū)動的股價(jià)飆升與2000年前后思科估值之間的相似之處。

看好英偉達(dá)和不看好英偉達(dá)的觀點(diǎn)是如此針鋒相對,以至于有人評價(jià)“英偉達(dá)正在分裂華爾街”。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

英偉達(dá)

6.3k
  • 英偉達(dá)或于12月宣布在泰國投資計(jì)劃
  • 機(jī)構(gòu):英偉達(dá)將Blackwell Ultra產(chǎn)品更名為B300系列,預(yù)計(jì)2025年將推動CoWoS-L增長

評論

暫無評論哦,快來評價(jià)一下吧!

下載界面新聞

微信公眾號

微博

英偉達(dá)凌晨打出了王炸,但已做不到通吃

在大模型訓(xùn)練市場,英偉達(dá)一騎絕塵,但在推理市場,它不得不用CUDA去打擊對手。

文|數(shù)智前線 徐鑫 趙艷秋

編輯|石兆

2024GTC大會上,當(dāng)外界對英偉達(dá)B200的性能驚嘆不已時(shí),黃仁勛也展現(xiàn)了他在通用AGI時(shí)代的完整戰(zhàn)略和布局。

在硬件層,新一代Blackwell架構(gòu)和B200芯片產(chǎn)品,順應(yīng)了AI計(jì)算洶涌浪潮下對更大規(guī)模、更高效計(jì)算能力的需求。黃仁勛判斷,GPU的形態(tài)發(fā)生變化,規(guī)模更為龐大的,用萬億美元武裝的數(shù)據(jù)中心,將成為人工智能生成器。

在這些強(qiáng)大的數(shù)據(jù)中心中,新的算力將創(chuàng)造大量新的軟件。這些智能軟件,將呈現(xiàn)出新的分發(fā)模式,除了云端,也會打包成人們可攜帶的個人智能應(yīng)用。英偉達(dá)意在用NIM平臺,支持應(yīng)用廠商開發(fā)智能應(yīng)用,將NIM打造為CUDA生態(tài)之后的一個AI應(yīng)用級入口。

而由于智能可移動,未來所有移動的東西都將是機(jī)器人,它們需要數(shù)字孿生系統(tǒng)Omniverse,作為機(jī)器人世界的操作系統(tǒng)。英偉達(dá)的人形機(jī)器人基礎(chǔ)模型Project GR00T和 數(shù)字孿生系統(tǒng)Ominicerse API基于這一布局。

業(yè)界觀察到,英偉達(dá)的Blackwell架構(gòu)GPU產(chǎn)品,將進(jìn)一步拉大與業(yè)界其他芯片企業(yè)在大模型訓(xùn)練上的差距,這種差距甚至可能在幾十倍水平。不過在大模型推理芯片上,已有不少企業(yè)搶奪了英偉達(dá)的市場份額。

綜合這些因素,資本市場對英偉達(dá)的未來走向也產(chǎn)生了分歧,這支當(dāng)下最受歡迎的股票,正在分裂華爾街。

01、大模型訓(xùn)練算力,英偉達(dá)一騎絕塵

這場大會在圣何塞鯊魚隊(duì)的主場舉行,現(xiàn)場氣氛熱烈,有媒體形容這場盛會更像是一個體育賽事或搖滾音樂會。

最受矚目的,當(dāng)然是黃仁勛發(fā)布了新的GPU架構(gòu)Blackwell,并釋出了該架構(gòu)下的最新人工智能芯片B200。

Blackwell架構(gòu)以數(shù)學(xué)家戴維·布萊克韋爾(David Blackwell)來命名。這是英偉達(dá)推出的第七代GPU。2012年5月英偉達(dá)發(fā)布開普勒架構(gòu),推出了兩款k10和k20加速器,正式開啟了GPU時(shí)代。

黃仁勛在演講中將Blackwell與上一代架構(gòu)Hopper做了對比,稱Blackwell是新工業(yè)革命的引擎。新架構(gòu)下的B200包含2080億個晶體管,比H100的800億個晶體管多2.5倍。B200可提供高達(dá)20千兆次的 AI 計(jì)算性能,是H100的5倍。

Blackwell架構(gòu)下GPU性能的提升,使得可支撐訓(xùn)練的生成式AI大模型參數(shù)量級,擴(kuò)展10萬億參數(shù)。

“我們需要更大的GPU?!秉S仁勛說。過去8年時(shí)間里AI算力需求有了1000倍增長。在Blackwell架構(gòu)下,芯片之間可連接構(gòu)建出大型AI超算集群,支撐更大的計(jì)算需求。

比如兩個B200 GPU與Grace CPU結(jié)合,通過900GB/s的NVLink互連技術(shù),構(gòu)成GB200超級芯片。兩個超級芯片形成一個計(jì)算節(jié)點(diǎn),18個計(jì)算節(jié)點(diǎn)構(gòu)成計(jì)算單元GB200 NVL72。它們可通過持續(xù)擴(kuò)展,最終構(gòu)成包含32000 GPU的分布式超算集群——英偉達(dá)DGX AI超級計(jì)算機(jī)。

黃仁勛在演講中提到,GPU的形態(tài)已徹底改變,未來“英偉達(dá)DGX AI超級計(jì)算機(jī),就是AI工業(yè)革命的工廠”。

英偉達(dá)還提供一組數(shù)據(jù)稱,由兩片B200組成的GB200,在基于1750億參數(shù)的GPT-3基準(zhǔn)測試中,性能大約是H100的七倍,而且英偉達(dá)稱它提供了4倍的訓(xùn)練速度。GB200將于今年晚些時(shí)候上市,英偉達(dá)尚未公布該超級芯片的售價(jià)。

業(yè)界觀察到,隨著發(fā)布新核彈,英偉達(dá)的GPU產(chǎn)品在AI訓(xùn)練上的性能和水平,與全球其他玩家的差距在進(jìn)一步拉大,甚至出現(xiàn)幾十倍的差距。

02、推理市場,英偉達(dá)丟失不少份額

“雖然從大模型訓(xùn)練上,其他芯片廠商望塵莫及,但對于推理市場,國內(nèi)外的芯片企業(yè),還是搶了不少英偉達(dá)的市場份額?!币晃毁Y深人士告訴數(shù)智前線,僅國內(nèi)就有十幾家相關(guān)企業(yè),更不用說還有谷歌、亞馬遜等大企業(yè)。

推理追求的是“能效比”,比拼每瓦的計(jì)算性能。而今年大模型落地呈現(xiàn)一個爆發(fā)式增長,對推理的需求已經(jīng)很大了。

這也造成在兩周前,英偉達(dá)在CUDA11.6更新版本中,特意突出了一則警告:禁止其他硬件平臺上運(yùn)行基于CUDA的軟件。

“它打擊的就是AI加速芯片領(lǐng)域。英偉達(dá)想高低通吃,既要把持訓(xùn)練市場,又要圍獵推理市場?!鄙鲜鲑Y深人士說。

CUDA生態(tài),是英偉達(dá)花20年時(shí)間持續(xù)做的“基本功”。CUDA的價(jià)值,可以用Wintel聯(lián)盟為例,英特爾芯片每兩年升級一代,而Windows系統(tǒng)的完善,實(shí)際上是讓業(yè)界將系統(tǒng)之上的應(yīng)用用起來,比如辦公、互聯(lián)網(wǎng)。

英偉達(dá)一方面持續(xù)推出新GPU,另一方面,它的CUDA面向生命科學(xué)、量化、自動駕駛等場景在開發(fā)庫,讓應(yīng)用企業(yè)不用從零開始,直接去調(diào)用,很快就能完成一個藥物分子、自動駕駛的應(yīng)用。“它的厲害之處是,可能CUDA上已經(jīng)寫了10萬行代碼,對于應(yīng)用企業(yè)來說,它再寫幾百行、幾千行代碼,就解決問題了?!?/p>

“我們原來一直說的一個詞叫云原生,現(xiàn)在正在發(fā)生的是AI原生,但對于業(yè)界來說,毫不夸張的說,一直都有一個CUDA原生?!辟Y深人士感嘆,因?yàn)樵贑UDA上,很多應(yīng)用不需要從零開始,它們可以快速切入一個領(lǐng)域或者一個行業(yè)。

這就是英偉達(dá)長期的護(hù)城河。英偉達(dá)禁止其他硬件平臺上運(yùn)行CUDA,直接就造成兩個結(jié)果:一是在場景落地的時(shí)候,其他芯片廠商要付出的工作量會比較大;二是對于大多數(shù)芯片廠商來說,沒有了CUDA,變成了孤軍作戰(zhàn)。雖然它能滿足一個項(xiàng)目的需求,長期發(fā)展變得更不容易。類似CUDA軟件層面的投入非常巨大,有業(yè)內(nèi)人士認(rèn)為,毛利率在50%以下的企業(yè)“想都別想”,而追上生態(tài),估計(jì)可能需要5~10年。

最近幾年,有報(bào)道在介紹國外追趕英偉達(dá)的芯片創(chuàng)業(yè)公司,目前從市場反饋看,都沒有真正做起來。

03、一年漲五倍,后續(xù)走向分裂華爾街

GTC大會召開的預(yù)期下,昨晚英偉達(dá)的股價(jià)高開,盤中一度上漲超過4%,之后出現(xiàn)回落,收盤價(jià)僅上漲0.7%。不過,到盤后股價(jià)略微下挫,跌1.7%。

過去一年多,自O(shè)penAI的ChatGPT在2022年末開啟生成式人工智能的繁榮以來,英偉達(dá)在資本市場一路狂飆,股價(jià)上漲五倍多。

2023年1月時(shí),英偉達(dá)股價(jià)最低點(diǎn)僅為142美元,到今年3月,股價(jià)最高點(diǎn)一度到達(dá)926美元。一時(shí)風(fēng)頭無兩。去年12月底,英偉達(dá)在經(jīng)紀(jì)公司分析師最喜歡的股票排行榜上,名列榜首。

隨著股價(jià)暴漲,到本月英偉達(dá)的市值最高超過2.2萬億美元,成為了全球市值第三的公司,僅次于微軟和蘋果。

由于過去12個月英偉達(dá)股價(jià)一路飆升,一些人士判斷這只股票會遭遇調(diào)整期,這也使得一些分析師不再將英偉達(dá)列入買入評級,在最受歡迎的股票榜上,英偉達(dá)甚至不再進(jìn)入前20名。

不過在GTC大會召開前,一些分析師已經(jīng)上調(diào)了英偉達(dá)的目標(biāo)股價(jià)。例如,匯豐銀行(HSBC)分析師 Frank Lee 維持對 Nvidia 股票的買入評級,但將其目標(biāo)股價(jià)從此前的882美元上調(diào)至1,050美元。新的股價(jià)目標(biāo)比 Nvidia當(dāng)下的交易價(jià)高出18% 。

看好英偉達(dá)的人士堅(jiān)定認(rèn)為,市場對AI算力的強(qiáng)烈需求,當(dāng)下英偉達(dá)的不可取代性仍然非常明顯,仍將受益于洶涌的AGI浪潮。同時(shí)英偉達(dá)的新一代芯片產(chǎn)品的市場需求依然火爆,例如,英偉達(dá)CFO Colette Kress在今年2月的財(cái)報(bào)電話會議時(shí)預(yù)估,下一代產(chǎn)品的市場需求將超過供給,尤其是今年晚些時(shí)候發(fā)貨的新一代芯片B100依然供應(yīng)緊張。

而在給英偉達(dá)當(dāng)下的走向潑冷水的人里,最知名的當(dāng)屬人稱“木頭姐”的華爾街明星基金經(jīng)理、方舟投資管理公司的CEO凱茜·伍德(Cathie Wood)。她此前也大量持有英偉達(dá)股票,并斬獲頗豐。

今年2月她拋售了近450萬美元的英偉達(dá)股票,并指出市場對英偉達(dá)的期待過高,并且隨著競爭加劇和庫存的調(diào)整,英偉達(dá)未來業(yè)績有可能面臨挑戰(zhàn)。

更激進(jìn)的聲音則認(rèn)為英偉達(dá)存在泡沫。例如有投資界人士提到,投資者應(yīng)該仔細(xì)英偉達(dá)的這波AI需求驅(qū)動的股價(jià)飆升與2000年前后思科估值之間的相似之處。

看好英偉達(dá)和不看好英偉達(dá)的觀點(diǎn)是如此針鋒相對,以至于有人評價(jià)“英偉達(dá)正在分裂華爾街”。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。