記者 | 彭新
主導人工智能(AI)計算的英偉達,再度從軟、硬件兩端拓展產(chǎn)業(yè)布局,構建其“全?!庇嬎闵鷳B(tài)。
時隔近兩年,芯片設計廠商英偉達于美國時間3月22日發(fā)布全新Hopper架構GPU(圖形處理器)H100,其主要用于數(shù)據(jù)中心,現(xiàn)已投入生產(chǎn),將于第三季度上市。
H100由臺積電代工,采用4納米制程,內含800億個晶體管。英偉達稱,新架構GPU的亮點在于搭載名為“Transfomer Engine”的AI計算核心,可大幅加速AI計算性能;安全性方面,通過機密計算功能,可保護企業(yè)AI模型和客戶數(shù)據(jù)。借助NVLink網(wǎng)絡連接技術,可達到近5TB每秒的外部數(shù)據(jù)傳輸速度,進一步加速數(shù)據(jù)處理。
此次英偉達更新GPU,為競爭對手再次立下標桿。在半精度、單精度、雙精度浮點等人工智能常用計算模型上,性能可達前代產(chǎn)品A100的3倍,而在FP8 Tensor Core技術上,性能甚至可達A100的6倍,遠高于近年國內廠商發(fā)布的AI專用計算芯片。不過,H100的最大設計功耗也達到了700瓦。
英偉達稱,國內的阿里云、騰訊云、百度智能云和海外的亞馬遜云科技(AWS)、微軟Azure、谷歌云等云服務商都計劃提供基于H100的服務和云端實例。而將為H100制造服務器的廠商包括思科、戴爾、浪潮、聯(lián)想、新華三等。英偉達還為H100配置多種規(guī)格,滿足多種帶寬、接口標準。
基于英偉達在網(wǎng)絡互聯(lián)技術的投資,H100的數(shù)據(jù)處理能力有了大幅提高?!?0個H100 GPU便可承載相當于全球互聯(lián)網(wǎng)的流量,使其能夠幫助客戶推出先進的推薦系統(tǒng)以及實時運行數(shù)據(jù)推理大型語言模型?!庇ミ_CEO黃仁勛稱。
GPU以外,英偉達也對其自研CPU(中央處理器)產(chǎn)品進展進行重點介紹,黃仁勛稱其為Grace超級芯片,是英偉達首款高性能計算用途CPU。Grace CPU采用Arm v9架構,內含144個Arm核心,提供最高的單線程核心效能,支持Arm新一代的向量擴充指令集。在服務器上,Grace CPU還可搭配英偉達DPU、GPU、智能網(wǎng)卡等產(chǎn)品,構成整體解決方案。
至此,基于CPU、GPU兩大新品,英偉達在數(shù)據(jù)中心的計算架構得以完整呈現(xiàn)。目前,在服務器CPU領域,市場仍為英特爾、AMD的x86新品所支配。而黃仁勛表示,Grace CPU面向高性能計算細分市場,如科學計算、數(shù)據(jù)分析等。在云計算、企業(yè)級計算、邊緣計算、工作站、個人電腦領域仍以現(xiàn)有CPU為主。
發(fā)布會上,黃仁勛還提出基于Hopper架構GPU和Grace CPU的“AI工廠”構想,并稱為數(shù)據(jù)中心的變革方向:企業(yè)以工業(yè)化規(guī)模提高數(shù)據(jù)中心AI算力,持續(xù)提煉數(shù)據(jù),進行訓練和完善AI模型,實現(xiàn)AI能力大規(guī)模輸出。
英偉達還宣布了其新超算系統(tǒng)Eos,該系統(tǒng)預計在今年晚些時候開始運行,比日本的“富岳”超級計算機還要快4倍,有望成為世界上最快的人工智能超算系統(tǒng)。
面向數(shù)據(jù)中心市場,兩大老牌芯片廠商英特爾和AMD仍有望正面阻擊英偉達。2021年6月,英特爾成立加速運算系統(tǒng)與繪圖處理事業(yè)群(AXG)。而在今年2月召開的投資者大會上,英特爾披露該事業(yè)群下三個子部門正按計劃出貨產(chǎn)品,涉及圖形計算、高性能計算與人工智能計算產(chǎn)品,預計2022年度將為公司帶來超過10億美元的營收。
AMD方面,在2011年11月,AMD宣布其Instinct MI200系列加速卡和ROCm 5配套軟件上市,面向數(shù)據(jù)中芯加速計算市場。今年2月,AMD完成收購可編程芯片公司賽靈思,應對數(shù)據(jù)中心應用場景的計算任務已呈現(xiàn)更加多樣化趨勢。