文|半導(dǎo)體產(chǎn)業(yè)縱橫
隨著云計(jì)算的蓬勃發(fā)展,各大IDC數(shù)據(jù)中心對(duì)服務(wù)器CPU的要求也是水漲船高。每逢有算力更強(qiáng)、性能更穩(wěn)、成本更低的服務(wù)器CPU上市,都會(huì)引發(fā)眾多數(shù)據(jù)中心用戶的高度關(guān)注。究其原因其實(shí)非常簡單:不論是一個(gè)百分點(diǎn)的性能提升,亦或是一個(gè)百分點(diǎn)的成本降低,數(shù)據(jù)中心里那么多臺(tái)服務(wù)器日積月累下來,也會(huì)是一筆非常驚人的數(shù)字。
過去20年里,云服務(wù)器CPU市場一直被英特爾的x86架構(gòu)統(tǒng)治,市場份額甚至一度超過90%。近幾年中,AMD一直緊隨后,窮追不舍,進(jìn)攻英特爾市場?,F(xiàn)在,服務(wù)器CPU領(lǐng)域風(fēng)云再起。
服務(wù)器CPU發(fā)展歷史
AMD和英特爾是PC制造領(lǐng)域最具標(biāo)志性的兩個(gè)名字。幾十年來,他們一直在努力為游戲玩家、休閑網(wǎng)絡(luò)瀏覽器和專業(yè)人士提供速度最快、功能最強(qiáng)大、功能最豐富的處理器。多年來,他們來來回回幾次激烈競爭。AMD推出了突破性的設(shè)計(jì),而英特爾則用自己的革命性芯片做出回應(yīng)。英特爾在2005年至2015年期間對(duì)旗艦性能保持了強(qiáng)有力的把握,AMD真正扭轉(zhuǎn)了局面推出其Ryzen處理器。
自英特爾在1978年推出第一顆x86處理器8086后,CPU的發(fā)展方向一直都是整合更多的指令集與外部控制器,以及更高的主頻。單核性能的提升除了架構(gòu)以外很重要的一點(diǎn)是取決于頻率和緩存,而頻率限于CPU溫度和功耗不可能增長太快,緩存限于CPU面積和成本同樣不能快速增長,這樣頻率和緩存只能依靠半導(dǎo)體工藝的進(jìn)步來逐步提升。當(dāng)CPU的單核效能與頻率都到瓶頸之后,英特爾與AMD都開始向多核發(fā)展。
英特爾從單核到多核之路
2005年5月,英特爾推出史上第一個(gè)雙核處理器Pentium D系列,采用90nm工藝核心,每核心擁有1MBL2緩存,均是800MHz的FSB,隨后還推出了帶超線程技術(shù)的Pentium Extreme Edition 840處理器,雙核四線程,F(xiàn)SB也提升到了1066MHz,頻率也更高。
之后,Pentium D處理器的繼任者是非常經(jīng)典的Core 2 Due處理器,而且他們還用當(dāng)年炮制首款雙核處理器的手法造出了首款四核處理器Core 2 Quad。
2013年英特爾推出的Corei7-980X是首款6核處理器,核心代號(hào)Gulftown,它基于Westmere架構(gòu),處理器每核心擁有256KB L2緩存,共享12MB L3緩存,主頻是3.33GHz,最高睿頻3.6GHz。
桌面市場的第一顆真八核處理器是英特爾在2014年推出的Corei7-5960X,屬于22nm的Haswell-E架構(gòu),基礎(chǔ)頻率3GHz,最高睿頻3.5GHz,擁有20MBL3緩存,屬于HEDT的X99平臺(tái)。
后來,Core i7-6950X成為首款桌面的十核處理器,生產(chǎn)工藝從22nm升級(jí)到14nm,核心數(shù)量從上代Core i7-5960X的8核增加到10核,晶體管數(shù)量也從26億增加到32億。
2017年,英特爾推出了第七代Core X系列處理器,包括Skylake-X與Kabylake-X兩種不同架構(gòu)的處理器,SkylakeX處理器多了12核、14核、16核、18核的產(chǎn)品,并且用Core i9取代Core i7成為英特爾消費(fèi)級(jí)市場上最強(qiáng)處理器的代名詞。
英特爾的Lakefield項(xiàng)目于2019年正式公開,2020年正式上市,這款產(chǎn)品的實(shí)驗(yàn)性質(zhì)很重,它是首款采用英特爾Foveros 3D堆疊工藝的產(chǎn)品,也是首款采用混合架構(gòu)的x86五核處理器。從此英特爾開啟混合架構(gòu)新時(shí)代。
AMD從雙核到96核
AMD的雙核處理器Athlon 64 X2誕生于2005年5月。但與英特爾的PentiumD不同,AMD的Athlon 64 X2是在同一塊芯片內(nèi)整合了兩個(gè)K8核心,兩個(gè)核心之間可透過System Request Queue實(shí)現(xiàn)數(shù)據(jù)互通,因此執(zhí)行效率遠(yuǎn)高于競爭對(duì)手產(chǎn)品。
2007年K10架構(gòu)的四核于11月11日發(fā)布,它確實(shí)是首款原生四核處理器,并且首次把L3緩存引入到消費(fèi)級(jí)市場,但整體效能不如對(duì)手的Core 2 Quad。主流平臺(tái)的八核處理器,是2017年Zen架構(gòu)的第一代Ryzen7列處理器,它正式引發(fā)了英特爾與AMD在處理器市場的核心數(shù)量大戰(zhàn)。
2018年發(fā)布的第二代銳龍Threadripper,最大核心數(shù)量已達(dá)到32核。到了銳龍Threadripper 3000,CPU被拆分成CCD計(jì)算核心和IOD輸入輸出核心,解決了每個(gè)核心之間訪問內(nèi)存和PCI-E時(shí)延遲不一的問題,于是2020年,64核的銳龍Threadriper3990X從此誕生。
最近,在AMD推出的新服務(wù)器CPU中,其核心已經(jīng)提高至96核??偟膩砜?,在高性能計(jì)算領(lǐng)域,以盡可能得使用多核心處理器,獲取更高的性能。
服務(wù)器CPU比拼激烈
在2022年投資者大會(huì)上,英特爾首次披露了2022-2024年的全新英特爾至強(qiáng)產(chǎn)品路線圖。至強(qiáng)Xeon是主要用于"中間范圍"的企業(yè)服務(wù)器和工作站。在英特爾的服務(wù)器主板上,最多達(dá)八個(gè)Xeon處理器能夠共用100MHz的總線而進(jìn)行多路處理。
目前,英特爾最新款服務(wù)器CPU仍舊是2021年推出的第三代至強(qiáng)(Xeon)可擴(kuò)展處理器(代號(hào)Ice Lake),其主要亮點(diǎn)包括:采用英特爾最新的10nm工藝,單個(gè)芯片最多包含40核。與上一代20核Cascade Lake相比,IPC性能提升20%;在主流數(shù)據(jù)中心工作負(fù)載上性能平均提升46%;74%的AI推理性能增加;與5年前的老系統(tǒng)相比,平均性能提升2.65倍。
來源:英特爾
從路線圖上看,英特爾下一代面向服務(wù)器領(lǐng)域CPU代號(hào)名為Sapphire Rapids。Sapphire Rapids采用12/13代酷睿同款的Intel7制造工藝,改用新的Socket E LGA4677封裝接口,首次引入chiplet小芯片封裝,物理層面最多60個(gè)Golden Cove微架構(gòu)核心但首批只開啟56個(gè)核心,集成112MB三級(jí)緩存,熱設(shè)計(jì)功耗350W。
其他方面,內(nèi)存支持八通道DDR5-4800,擴(kuò)展連接提供80條PCIe 5.0/4.0通道,可選集成最多64GB HBM2e內(nèi)存,還會(huì)支持CXL 1.0高速互連總線。
事實(shí)上,英特爾希望這款新處理器能憑借對(duì)DDR5、PCIe Gen5和Compute Express Link等新技術(shù)的率先支持,在市場上全面壓制住AMD的下一代Epyc芯片Genoa。
然而,Sapphire Rapids的面世之路并不順?biāo)臁Hツ?月,英特爾表示將把芯片的量產(chǎn)從2021年第四季度推遲至2022年第一季度,并計(jì)劃在第二季度增加出貨量。后來,英特爾又表示推遲計(jì)劃,將在今年年底。目前,英特爾最終確定發(fā)表時(shí)間為2023年1月。
對(duì)此,英特爾高級(jí)研究員Ronak Singhal之前做了解釋,他表示對(duì)英特爾這樣的公司來說,優(yōu)先考慮的是下一代至強(qiáng)處理器的質(zhì)量。
AMD和英特爾在服務(wù)器CPU上的比拼從未停止。此前就有分析指出,AMD將以高于同行的速度增長,繼續(xù)從競爭對(duì)手英特爾手上奪取市場份額,包括個(gè)人計(jì)算和服務(wù)器市場,這一趨勢將在今年和明年持續(xù),預(yù)計(jì)至少會(huì)保持到2024年末。AMD之所以能保持上升趨勢,很大程度得益于EPYC處理器在服務(wù)器市場的表現(xiàn)。
與英特爾第三代至強(qiáng)Ice Lake叫陣的是AMD Milan。Milan是7nm,具有64個(gè)內(nèi)核和128個(gè)線程,可容納高達(dá)4TB的內(nèi)存容量,并提供128個(gè)PCIe通道。Milan在其更新的微架構(gòu)中打破了羅馬,支持小芯片連接,并導(dǎo)致更多的L3緩存和減少的延遲。相較上一代性能提升19%;峰值功率增加17%。
對(duì)于下一代服務(wù)器CPU的競爭方面,英特爾宣布了推遲發(fā)布時(shí)間,但AMD依舊選擇了在今年11月交出了其Epyc處理器系列的第四個(gè)版本,發(fā)布了代號(hào)Genoa(熱那亞)的第四代EPYC9004系列處理器,基于Zen4架構(gòu),最多96核心192線程,支持12通道DDR5內(nèi)存、128條PCIe5.0。
根據(jù)路線圖,AMD還準(zhǔn)備了一個(gè)Zen4c版本,產(chǎn)品代號(hào)Bergamo(貝加莫),主打多核心與高密度計(jì)算,最多128核心256線程、12通道DDR5,使用和Genoa同樣的SP5接口,互相兼容。第四代Epyc使用5nm制造(以及用于內(nèi)存的小芯片6nm)將900億個(gè)晶體管封裝到處理器中。AMD CTO Mark Papermaster近日接受采訪時(shí)透露,Bergamo將在明年上半年正式發(fā)布。
可以看到,英特爾的Sapphire Rapid與AMD 128核Bergamo的發(fā)布時(shí)間均在明年上半年,這其中火藥味十足。
服務(wù)器CPU涌向Arm
對(duì)服務(wù)器領(lǐng)域的追逐從未停止的,不僅有X86架構(gòu),還有Arm陣營。2018年10月,Arm首次宣布推出面向云到邊緣基礎(chǔ)設(shè)施產(chǎn)品Neoverse及其初步路線圖,并承諾平臺(tái)效能30%的年增長率指標(biāo)將持續(xù)到2022年及以后。2020年9月,Neoverse再度進(jìn)階,新增兩個(gè)全新的平臺(tái)—Neoverse V1平臺(tái)以及第二代的N系列平臺(tái)Neoverse N2。
ArmNeoverse平臺(tái)路線圖
Omdia的數(shù)據(jù)顯示,二季度Arm已拿下全球7.1%的服務(wù)器CPU市場。去年,阿里旗下的平頭哥發(fā)布自研云芯片倚天710,它基于Arm架構(gòu),官方稱之為“全球性能領(lǐng)先的云原生處理芯片”,性能超過業(yè)界標(biāo)桿20%,能效比提升50%以上。
日本RIKEN實(shí)驗(yàn)室的“Fugaku”使用的Arm架構(gòu)CPU,采用定制的ArmV8架構(gòu),依托7納米FinFET制程技術(shù)生產(chǎn)。浮點(diǎn)運(yùn)算部分是與Arm合作開發(fā)的SVE指令擴(kuò)展,使用512bit浮點(diǎn)運(yùn)算單元,大幅強(qiáng)化運(yùn)算能力。
最近,亞馬遜旗下云計(jì)算部門AWS宣布推出全新基于Arm架構(gòu)、自研的高性能計(jì)算服務(wù)器CPU芯片Graviton 3E。運(yùn)算性能比上一代多出35%,可組成最多64組虛擬CPU,并具有128GB存儲(chǔ)容量,最快將在2023年初開始布署應(yīng)用。
AWS高級(jí)副總裁彼得·德桑提斯(PeterDeSantis)更表示,這款處理器在某些高性能計(jì)算能力上是現(xiàn)有Graviton芯片的兩倍,和其他AWS技術(shù)結(jié)合時(shí),新芯片的性能還能再提高20%,他更直言,和購買英特爾、英偉達(dá)、AMD芯片相比,Graviton3E可以提供性價(jià)比更好的算力。
服務(wù)器CPU的領(lǐng)域,開始了新一輪的較量。