界面新聞?dòng)浾?| 彭新 李彪
界面新聞編輯 | 文姝琪
抓住生成式AI機(jī)會的英偉達(dá)全面出擊,為大小挑戰(zhàn)者設(shè)下新標(biāo)桿。
隨著人工智能革命席卷而來,英偉達(dá)的旗艦技術(shù)會議GTC已被外界視為“全球AI風(fēng)向標(biāo)”,美國時(shí)間3月18日,英偉達(dá)CEO黃仁勛的開幕演說更是備受外界關(guān)注,在此次黃仁勛的主講環(huán)節(jié)在美國圣何塞SAP中心舉行。
在開場,黃仁勛以“這不是一場音樂會”進(jìn)行調(diào)侃,稱在科技業(yè)外,仍有來自全球價(jià)值百萬億美元的行業(yè)從業(yè)者出席了會議,他對此感到非常自豪。黃仁勛稱,隨著ChatGPT的問世,激發(fā)了大眾對于AI的想象,各種創(chuàng)新應(yīng)用和創(chuàng)業(yè)公司陸續(xù)誕生,一個(gè)全新的時(shí)代已經(jīng)來臨了。
英偉達(dá)市值僅2024年就增加了1萬億美元,使其一舉成為標(biāo)準(zhǔn)普爾500指數(shù)中表現(xiàn)最好的股票,因此市場高度關(guān)注GTC相關(guān)消息。美股3月18日,英偉達(dá)收報(bào)884.55美元/股,漲0.7%。
“Blackwell”成為平臺:GPU、DPU、NVLink全線更新
市場最為關(guān)注,英偉達(dá)時(shí)隔兩年發(fā)布全新“Blackwell”架構(gòu)GPU(圖形處理器)如約亮相。
Blackwell用于數(shù)據(jù)中心,針對當(dāng)前火爆的AI大模型優(yōu)化,訓(xùn)練、推理性能和能效均大幅提升,與英偉達(dá)Grace CPU、新一代網(wǎng)絡(luò)芯片等產(chǎn)品一起,面向生成式AI共同組成完整解決方案。黃仁勛還特意稱,Blackwell不只是芯片,而是一個(gè)全新的平臺。至此英偉達(dá)從芯片走向了類似蘋果的平臺之路。
新GPU架構(gòu)“Blackwell”得名于美國數(shù)學(xué)家David Harold Blackwell,基于該架構(gòu)的GPU芯片B200采用臺積電4NP制造工藝,英偉達(dá)稱其可實(shí)現(xiàn)在十萬億級參數(shù)模型上的AI訓(xùn)練和實(shí)時(shí)LLM(大語言模型)推理。
B200由兩個(gè)超大型Die(裸片)封裝組合而成,內(nèi)含超過2080億個(gè)晶體管,是前一代800億個(gè)晶體管的兩倍以上,整塊芯片還封裝有192GB高速HBM3e顯存。
在演講中,英偉達(dá)CEO黃仁勛將Blackwell稱為“推動(dòng)新一輪工業(yè)革命的引擎”,并定義其為一個(gè)平臺,基于Blackwell,衍生出GPU、AI超級芯片、服務(wù)器、大型計(jì)算集群、云服務(wù)等多套解決方案。
此前,英偉達(dá)發(fā)布了“Grace Hopper”超級芯片,隨著Blackwell架構(gòu)GPU發(fā)布,英偉達(dá)順勢推出“Grace Blackwell”GB200超級芯片,GB200由兩個(gè)B200 GPU和Grace GPU相連。
英偉達(dá)表示,基于Blackwell的處理器,B200為人工智能公司提供了巨大的性能升級,其AI性能為每秒20千萬億次浮點(diǎn)運(yùn)算,而此前最強(qiáng)的H100為每秒4千萬億次浮點(diǎn)運(yùn)算,約是其5倍。該系統(tǒng)可以部署一個(gè)27萬億參數(shù)的模型。而目前據(jù)稱OpenAI的GPT-4使用了約1.76萬億個(gè)參數(shù)來訓(xùn)練系統(tǒng)。
一般而言,在數(shù)據(jù)中心架構(gòu)中,通用性更高的CPU負(fù)責(zé)數(shù)據(jù)的查詢、存儲;而GPU則更擅長并行計(jì)算,因此承擔(dān)推理的任務(wù)。除了CPU、GPU本身帶寬大小決定了傳輸速度,CPU與GPU間的數(shù)據(jù)傳輸還存在“帶寬瓶頸”,這一瓶頸同樣由NVLink連接協(xié)議方案所解決。
Blackwell GPU計(jì)算性能強(qiáng)勁,但面對大模型時(shí)代的GPU集群計(jì)算,如何解決芯片之間的數(shù)據(jù)傳輸問題已成為瓶頸。對此,英偉達(dá)同步推出新一代NVLink連接協(xié)議方案和NVSwitch芯片,組成X800系列交換機(jī),大幅提高數(shù)據(jù)吞吐量至800Gb/s,用來處理GPU之間的數(shù)據(jù)傳輸,進(jìn)一步增強(qiáng)GPU集群擴(kuò)展性和計(jì)算能力。
英偉達(dá)還發(fā)布了GB200 NVL72,整合英偉達(dá)在數(shù)據(jù)中心硬件方案中GPU、DPU、NVLink等技術(shù)的最新成果,構(gòu)成驅(qū)動(dòng)大語言模型背后的引擎。
GB200 NVL72進(jìn)入云端,成為云廠商計(jì)算實(shí)例,黃仁勛在演講中還發(fā)布搭載B100 GPU的AI云服務(wù)DGX Cloud。通過與云廠商平臺向用戶提供能夠訓(xùn)練生成式AI大模型,及其他AI應(yīng)用的算力月租服務(wù),該服務(wù)將首先上線亞馬遜云、微軟Azure和甲骨文云。
B200 GPU將于今年晚些時(shí)候推出,英偉達(dá)稱,包括亞馬遜云科技、戴爾科技、谷歌、Meta、微軟、OpenAI、甲骨文、特斯拉和xAI將計(jì)劃采用Blackwell產(chǎn)品。
人形機(jī)器人基礎(chǔ)模型和Isaac機(jī)器人平臺大更新
英偉達(dá)過去針對機(jī)器人市場的Isaac 機(jī)器人平臺也得到重大更新,包括發(fā)布了一款基于Thor芯片的新型人形機(jī)器人計(jì)算機(jī)Jetson Thor,以及一系列機(jī)器人預(yù)訓(xùn)練模型、庫和參考硬件,在生成式AI基礎(chǔ)模型和仿真工具,以及英偉達(dá)算力的支持下,進(jìn)一步對人形機(jī)器人應(yīng)用優(yōu)化。
Jetson Thor提供每秒800萬億次8位浮點(diǎn)運(yùn)算AI性能,可以運(yùn)行GR00T等多模態(tài)生成式AI模型,并大大簡化設(shè)計(jì)和集成工作。
英偉達(dá)稱,正在為多家人形機(jī)器人公司開發(fā)一個(gè)綜合AI平臺,如1X Technologies、Agility Robotics、Apptronik、波士頓動(dòng)力公司、Figure AI、傅利葉智能、Sanctuary AI、宇樹科技和小鵬鵬行等。
在黃仁勛的主題演講過程中,迪士尼生產(chǎn)的使用相關(guān)英偉達(dá)芯片的Orange和Green機(jī)器人也登上了舞臺現(xiàn)場亮相。
“開發(fā)通用人形機(jī)器人基礎(chǔ)模型是當(dāng)今AI領(lǐng)域中最令人興奮的課題之一。世界各地的機(jī)器人技術(shù)領(lǐng)導(dǎo)者正在匯集各種賦能技術(shù),致力于在人工通用機(jī)器人領(lǐng)域?qū)崿F(xiàn)突破?!秉S仁勛也現(xiàn)場表達(dá)了公司對人形機(jī)器人研究的支持。
自動(dòng)駕駛:多項(xiàng)重要合作宣布
黃仁勛在GTC主題演講中宣布,集中式車載計(jì)算平臺DRIVE Thor將搭載專為Transformer、大語言模型(LLM)和生成式AI工作負(fù)載而打造的全新Blackwell架構(gòu)。
2015年,英偉達(dá)進(jìn)入車載計(jì)算平臺領(lǐng)域,推出了初代自動(dòng)駕駛計(jì)算平臺DRIVE PX和Tegra系列車載芯片,后陸續(xù)發(fā)布Xavier芯片、Orin芯片問世,。2022年又在汽車業(yè)務(wù)增速放緩的情況下,英偉達(dá)正式推出新一代自動(dòng)駕駛計(jì)算芯片DRIVE Thor,當(dāng)時(shí)公布的單顆算力高達(dá)2000 TOPS,是特斯拉FSD芯片算力的14倍。
多家頭部電動(dòng)汽車制造商在GTC上展示了其搭載DRIVE Thor的下一代AI車型,既包括比亞迪、廣汽埃安、小鵬、理想汽車和極氪等眾多中國車企,也包括了文遠(yuǎn)知行等自動(dòng)駕駛平臺公司。
根據(jù)弗若沙利文統(tǒng)計(jì)數(shù)據(jù)顯示,2022年英偉達(dá)出貨量占到全球高算力自動(dòng)駕駛芯片市場份額為82.5%。按照黃仁勛的規(guī)劃,未來汽車業(yè)務(wù)將與數(shù)據(jù)中心、游戲并列成為英偉達(dá)的三大支柱業(yè)務(wù)。
推理微服務(wù)成為AI入口:已用于量子計(jì)算、醫(yī)藥行業(yè)
除了硬件產(chǎn)品,英偉達(dá)還與大量與企業(yè)合作,推進(jìn)AI落地。在發(fā)布會上,英偉達(dá)的推理微服務(wù)(NIM)頗具野心,它將作為企業(yè)AI的入口。
該服務(wù)有望支撐英偉達(dá)未來在AI服務(wù)上的營收增長,其具體模式為:英偉達(dá)提供預(yù)訓(xùn)練好的AI模型并開放API(應(yīng)用程序接口),再由行業(yè)客戶開發(fā)應(yīng)用,以簡化企業(yè)自己開發(fā)生成式AI應(yīng)用的成本。
黃仁勛也在現(xiàn)場示范了英偉達(dá)內(nèi)部藉NIM所打造的“芯片設(shè)計(jì)聊天機(jī)器人”,經(jīng)過數(shù)據(jù)訓(xùn)練和模型微調(diào)后,聊天機(jī)器人即可給出符合芯片設(shè)計(jì)領(lǐng)域的答案,甚至能同步生成所需的程序代碼。
在量子計(jì)算領(lǐng)域,英偉達(dá)宣布推出云量子計(jì)算機(jī)模擬微服務(wù),幫助研究人員和開發(fā)人員在化學(xué)、生物學(xué)、材料科學(xué)等科學(xué)領(lǐng)域的量子計(jì)算研究,該服務(wù)基于開源CUDA-Q量子計(jì)算平臺,支持用戶在云端構(gòu)建并測試新的量子算法和應(yīng)用,包括支持量子-經(jīng)典混合算法編程的模擬器和工具等。與其他云服務(wù)不同,英偉達(dá)目前還沒有量子計(jì)算機(jī),但未來它將提供第三方量子計(jì)算機(jī)的訪問。
在醫(yī)藥領(lǐng)域,英偉達(dá)宣布旗下包括Parabricks、MONAI、NeMo?、Riva、Metropolis,現(xiàn)已通CUDA-X微服務(wù)提供訪問,以加速藥物研發(fā)、醫(yī)學(xué)影像、基因組學(xué)分析等醫(yī)療工作流程。
英偉達(dá)還介紹,其已經(jīng)推出的25個(gè)面向醫(yī)療領(lǐng)域的微服務(wù),可以加快醫(yī)療企業(yè)的轉(zhuǎn)型,包括篩選數(shù)萬億種藥物化合物以促進(jìn)醫(yī)學(xué)發(fā)展、收集更完善的患者數(shù)據(jù)以改進(jìn)早期疾病檢測、實(shí)現(xiàn)更智能的數(shù)字助手等。
長期以來黃仁勛向外強(qiáng)調(diào),摩爾定律已死,計(jì)算范式正發(fā)生改變,由CPU主導(dǎo)的通用計(jì)算轉(zhuǎn)向GPU的加速計(jì)算,GPU在行業(yè)場景下有大量替代CPU的機(jī)會,生成式AI更大大加速了這一進(jìn)程。
此前英偉達(dá)宣布的計(jì)算光刻平臺cuLitho,已成為一大成功案例,在GTC上,英偉達(dá)宣布,臺積電和EDA公司新思科技將在生產(chǎn)中使用cuLitho,在生成式AI應(yīng)用算法幫助下,晶圓廠的芯片生產(chǎn)效率將大幅提高。
數(shù)字人和虛擬助手:更真實(shí)的游戲體驗(yàn)來了
游戲起家的英偉達(dá),自然也沒有忘記人工智能技術(shù)在游戲領(lǐng)域大顯身手,這次GTC上重點(diǎn)展示的是它的數(shù)字人技術(shù)。
英偉達(dá)數(shù)字人平臺包括三項(xiàng)主要技術(shù):NVIDIA ACE、NVIDIA NeMo和RTX光線追蹤技術(shù),分別通過AI驅(qū)動(dòng)游戲角色語言、語音、動(dòng)畫和圖形。
其中,NVIDIA ACE可幫助開發(fā)者通過Audio2Face驅(qū)動(dòng)的面部動(dòng)畫以及由Riva自動(dòng)語音識別(ASR)和文本轉(zhuǎn)語音(TTS)驅(qū)動(dòng)的語音交流,讓數(shù)字人交互更加生動(dòng)。英偉達(dá)稱,NVIDIA ACE允許模型在云端和PC上運(yùn)行,以確保用戶獲得最佳體驗(yàn)。此外,全球游戲發(fā)行商正評估NVIDIA ACE如何改善游戲體驗(yàn)。
NVIDIA NeMo可幫助開發(fā)者提供企業(yè)級生成式AI模型,包括精確數(shù)據(jù)管理、模型個(gè)性化定制、檢索增強(qiáng)生成和加速性能等。最后,包含RTX全局光照 (RTXGI) 和DLSS 3.5等渲染技術(shù)的集合,可在游戲和應(yīng)用中實(shí)現(xiàn)實(shí)時(shí)光線路徑追蹤。