正在閱讀:

英偉達(dá)的內(nèi)存未來(lái):一個(gè)GPU上堆疊20個(gè)DRAM芯片

掃一掃下載界面新聞APP

英偉達(dá)的內(nèi)存未來(lái):一個(gè)GPU上堆疊20個(gè)DRAM芯片

堆疊更多的DRAM芯片,為GPU芯片帶來(lái)更多助力。

文|半導(dǎo)體產(chǎn)業(yè)縱橫

據(jù)Trendforce 報(bào)道,內(nèi)存制造商三星、SK 海力士和美光希望堆疊更多 DRAM 芯片。隨著第五代堆疊 DRAM 高帶寬內(nèi)存 (HBM5) 的推出,至少有 20 個(gè)內(nèi)存層。

目前的 HBM3e 設(shè)備使用 8 個(gè) 24 千兆位芯片,總?cè)萘繛?24 千兆字節(jié)。12 倍堆疊的 HBM3e 模塊(稱(chēng)為 12-Hi)已發(fā)布,容量為 36 千兆字節(jié)。每個(gè)芯片具有相同容量的 20-Hi 變體的容量為 60 千兆字節(jié),但后者可能會(huì)同時(shí)增加,以實(shí)現(xiàn)更高的存儲(chǔ)量。

高帶寬內(nèi)存的未來(lái)。Nvidia 顯然已經(jīng)在規(guī)劃 HBM5。

不過(guò),該產(chǎn)品還需要幾年時(shí)間才能上市。Trendforce 估計(jì) Nvidia 希望在下一代產(chǎn)品中使用 HBM5。屆時(shí)它將不再位于 GPU 旁邊并通過(guò)硅中介層連接,而是直接安裝在 GPU 上。

Blackwell(B100 和 B200)仍使用 HBM3e。Nvidia已宣布將在 2026 年推出具有八個(gè) HBM4 堆棧的 Rubin;具有 12 個(gè)堆棧的改進(jìn)版本 Rubin Ultra 將于 2027 年問(wèn)世。具有 HBM4e 的 Rubin 繼任者將于 2028 年問(wèn)世,而具有 HBM5 的繼任者最早將于 2029 年問(wèn)世。

混合鍵合取代焊球

在此之前,制造商必須解決生產(chǎn)問(wèn)題。到目前為止,他們一直在 DRAM 層之間使用焊球,即所謂的微凸塊。三星和美光依靠熱壓縮非導(dǎo)電膜 (TC-NCF) 來(lái)實(shí)現(xiàn)穩(wěn)定:他們將一層薄膜貼在單個(gè)芯片上,薄膜在高溫和高壓下熔化,從而將各層粘合在一起。

SK Hynix 依靠所謂的大規(guī)?;亓鞒尚偷撞刻畛?(MR-MUF) 來(lái)改善散熱。制造商對(duì)此的描述如下:“大規(guī)?;亓魇且环N通過(guò)熔化堆疊芯片之間的凸塊將芯片粘合在一起的技術(shù)。模塑底部填充用保護(hù)材料填充堆疊芯片之間的間隙,以提高耐用性和散熱性。MR-MUF 結(jié)合使用回流和成型工藝,將半導(dǎo)體芯片連接到電路上,并用液態(tài)環(huán)氧模塑化合物 (EMC) 填充芯片和凸塊間隙之間的空間。”

但隨著容量和時(shí)鐘頻率的不斷提高,組件產(chǎn)生的熱量也隨之增加。此外,制造商必須節(jié)省空間才能將 20 個(gè)內(nèi)存層壓入一個(gè)組件中。

據(jù)稱(chēng),該解決方案是混合鍵合,AMD 此前已在其帶有堆疊緩存的 Ryzen X3D 處理器中使用過(guò)該技術(shù)。然后,將所有 DRAM 層磨平,以便它們彼此粘合在一起而沒(méi)有焊點(diǎn)(凸塊)。為了實(shí)現(xiàn)這一點(diǎn),制造商必須轉(zhuǎn)換其封裝系統(tǒng)。三星大概也希望將這項(xiàng)技術(shù)用于 SSD 的 NAND 閃存。

如果制造商有意提前積累該技術(shù)經(jīng)驗(yàn),16 層堆疊的 HBM4 和 HBM4e 堆疊(16-Hi)也可能采用混合鍵合。然而,這顯然在技術(shù)上還不是必要的。

高堆疊內(nèi)存的 GPU 在制造成本上必然會(huì)有顯著的提升。首先,研發(fā)新的散熱技術(shù)、信號(hào)處理技術(shù)和封裝工藝都需要投入大量的資金。與此同時(shí),該技術(shù)還存在諸多挑戰(zhàn)。

在一個(gè) GPU 上堆疊 20 個(gè) DRAM 芯片,散熱將成為首要面臨的巨大挑戰(zhàn)。大量芯片在高速運(yùn)行時(shí)會(huì)產(chǎn)生可觀的熱量,如果不能有效地進(jìn)行散熱處理,將導(dǎo)致芯片性能下降甚至損壞。英偉達(dá)將不得不投入大量研發(fā)資源來(lái)開(kāi)發(fā)新的散熱技術(shù)。例如,可能會(huì)探索更高效的散熱材料,從傳統(tǒng)的銅基散熱片轉(zhuǎn)向石墨烯等具有超高熱導(dǎo)率的新型材料。同時(shí),液冷技術(shù)也可能會(huì)得到進(jìn)一步發(fā)展和優(yōu)化,設(shè)計(jì)出更加精細(xì)且適配這種高芯片密度的液冷系統(tǒng),確保每個(gè) DRAM 芯片都能在適宜的溫度下工作。

在如此高密度的芯片堆疊下,信號(hào)完整性也是一個(gè)亟待解決的問(wèn)題。眾多芯片之間的信號(hào)傳輸路徑變得更加復(fù)雜,電磁干擾、信號(hào)延遲等問(wèn)題容易出現(xiàn)。英偉達(dá)需要在芯片設(shè)計(jì)和電路布局上進(jìn)行創(chuàng)新。比如,采用更先進(jìn)的布線技術(shù),增加信號(hào)屏蔽層來(lái)減少電磁干擾。同時(shí),在芯片之間可能會(huì)引入新的信號(hào)補(bǔ)償和校準(zhǔn)機(jī)制,實(shí)時(shí)監(jiān)測(cè)和調(diào)整信號(hào)的傳輸狀態(tài),確保從一個(gè) DRAM 芯片到 GPU 核心的數(shù)據(jù)傳輸準(zhǔn)確無(wú)誤,維持整個(gè)系統(tǒng)的高性能運(yùn)行。

此外,制造工藝將面臨更高的要求。要實(shí)現(xiàn) 20 個(gè) DRAM 芯片的穩(wěn)定堆疊,對(duì)芯片的封裝工藝提出了近乎苛刻的條件。目前的封裝技術(shù)可能無(wú)法滿(mǎn)足這種高復(fù)雜度的要求,英偉達(dá)需要與芯片制造廠商緊密合作,共同研發(fā)新的封裝工藝。

在這個(gè)過(guò)程中,如何保證高良品率是關(guān)鍵。因?yàn)殡S著制造復(fù)雜度的提升,不良品出現(xiàn)的概率也會(huì)增加。這可能需要在生產(chǎn)流程中引入更精密的檢測(cè)設(shè)備和方法,從芯片原材料的篩選到每一道生產(chǎn)工序都進(jìn)行嚴(yán)格的質(zhì)量把控,以確保最終產(chǎn)品能夠達(dá)到預(yù)期的性能和可靠性標(biāo)準(zhǔn)。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

英偉達(dá)的內(nèi)存未來(lái):一個(gè)GPU上堆疊20個(gè)DRAM芯片

堆疊更多的DRAM芯片,為GPU芯片帶來(lái)更多助力。

文|半導(dǎo)體產(chǎn)業(yè)縱橫

據(jù)Trendforce 報(bào)道,內(nèi)存制造商三星、SK 海力士和美光希望堆疊更多 DRAM 芯片。隨著第五代堆疊 DRAM 高帶寬內(nèi)存 (HBM5) 的推出,至少有 20 個(gè)內(nèi)存層。

目前的 HBM3e 設(shè)備使用 8 個(gè) 24 千兆位芯片,總?cè)萘繛?24 千兆字節(jié)。12 倍堆疊的 HBM3e 模塊(稱(chēng)為 12-Hi)已發(fā)布,容量為 36 千兆字節(jié)。每個(gè)芯片具有相同容量的 20-Hi 變體的容量為 60 千兆字節(jié),但后者可能會(huì)同時(shí)增加,以實(shí)現(xiàn)更高的存儲(chǔ)量。

高帶寬內(nèi)存的未來(lái)。Nvidia 顯然已經(jīng)在規(guī)劃 HBM5。

不過(guò),該產(chǎn)品還需要幾年時(shí)間才能上市。Trendforce 估計(jì) Nvidia 希望在下一代產(chǎn)品中使用 HBM5。屆時(shí)它將不再位于 GPU 旁邊并通過(guò)硅中介層連接,而是直接安裝在 GPU 上。

Blackwell(B100 和 B200)仍使用 HBM3e。Nvidia已宣布將在 2026 年推出具有八個(gè) HBM4 堆棧的 Rubin;具有 12 個(gè)堆棧的改進(jìn)版本 Rubin Ultra 將于 2027 年問(wèn)世。具有 HBM4e 的 Rubin 繼任者將于 2028 年問(wèn)世,而具有 HBM5 的繼任者最早將于 2029 年問(wèn)世。

混合鍵合取代焊球

在此之前,制造商必須解決生產(chǎn)問(wèn)題。到目前為止,他們一直在 DRAM 層之間使用焊球,即所謂的微凸塊。三星和美光依靠熱壓縮非導(dǎo)電膜 (TC-NCF) 來(lái)實(shí)現(xiàn)穩(wěn)定:他們將一層薄膜貼在單個(gè)芯片上,薄膜在高溫和高壓下熔化,從而將各層粘合在一起。

SK Hynix 依靠所謂的大規(guī)模回流成型底部填充 (MR-MUF) 來(lái)改善散熱。制造商對(duì)此的描述如下:“大規(guī)模回流是一種通過(guò)熔化堆疊芯片之間的凸塊將芯片粘合在一起的技術(shù)。模塑底部填充用保護(hù)材料填充堆疊芯片之間的間隙,以提高耐用性和散熱性。MR-MUF 結(jié)合使用回流和成型工藝,將半導(dǎo)體芯片連接到電路上,并用液態(tài)環(huán)氧模塑化合物 (EMC) 填充芯片和凸塊間隙之間的空間?!?/p>

但隨著容量和時(shí)鐘頻率的不斷提高,組件產(chǎn)生的熱量也隨之增加。此外,制造商必須節(jié)省空間才能將 20 個(gè)內(nèi)存層壓入一個(gè)組件中。

據(jù)稱(chēng),該解決方案是混合鍵合,AMD 此前已在其帶有堆疊緩存的 Ryzen X3D 處理器中使用過(guò)該技術(shù)。然后,將所有 DRAM 層磨平,以便它們彼此粘合在一起而沒(méi)有焊點(diǎn)(凸塊)。為了實(shí)現(xiàn)這一點(diǎn),制造商必須轉(zhuǎn)換其封裝系統(tǒng)。三星大概也希望將這項(xiàng)技術(shù)用于 SSD 的 NAND 閃存。

如果制造商有意提前積累該技術(shù)經(jīng)驗(yàn),16 層堆疊的 HBM4 和 HBM4e 堆疊(16-Hi)也可能采用混合鍵合。然而,這顯然在技術(shù)上還不是必要的。

高堆疊內(nèi)存的 GPU 在制造成本上必然會(huì)有顯著的提升。首先,研發(fā)新的散熱技術(shù)、信號(hào)處理技術(shù)和封裝工藝都需要投入大量的資金。與此同時(shí),該技術(shù)還存在諸多挑戰(zhàn)。

在一個(gè) GPU 上堆疊 20 個(gè) DRAM 芯片,散熱將成為首要面臨的巨大挑戰(zhàn)。大量芯片在高速運(yùn)行時(shí)會(huì)產(chǎn)生可觀的熱量,如果不能有效地進(jìn)行散熱處理,將導(dǎo)致芯片性能下降甚至損壞。英偉達(dá)將不得不投入大量研發(fā)資源來(lái)開(kāi)發(fā)新的散熱技術(shù)。例如,可能會(huì)探索更高效的散熱材料,從傳統(tǒng)的銅基散熱片轉(zhuǎn)向石墨烯等具有超高熱導(dǎo)率的新型材料。同時(shí),液冷技術(shù)也可能會(huì)得到進(jìn)一步發(fā)展和優(yōu)化,設(shè)計(jì)出更加精細(xì)且適配這種高芯片密度的液冷系統(tǒng),確保每個(gè) DRAM 芯片都能在適宜的溫度下工作。

在如此高密度的芯片堆疊下,信號(hào)完整性也是一個(gè)亟待解決的問(wèn)題。眾多芯片之間的信號(hào)傳輸路徑變得更加復(fù)雜,電磁干擾、信號(hào)延遲等問(wèn)題容易出現(xiàn)。英偉達(dá)需要在芯片設(shè)計(jì)和電路布局上進(jìn)行創(chuàng)新。比如,采用更先進(jìn)的布線技術(shù),增加信號(hào)屏蔽層來(lái)減少電磁干擾。同時(shí),在芯片之間可能會(huì)引入新的信號(hào)補(bǔ)償和校準(zhǔn)機(jī)制,實(shí)時(shí)監(jiān)測(cè)和調(diào)整信號(hào)的傳輸狀態(tài),確保從一個(gè) DRAM 芯片到 GPU 核心的數(shù)據(jù)傳輸準(zhǔn)確無(wú)誤,維持整個(gè)系統(tǒng)的高性能運(yùn)行。

此外,制造工藝將面臨更高的要求。要實(shí)現(xiàn) 20 個(gè) DRAM 芯片的穩(wěn)定堆疊,對(duì)芯片的封裝工藝提出了近乎苛刻的條件。目前的封裝技術(shù)可能無(wú)法滿(mǎn)足這種高復(fù)雜度的要求,英偉達(dá)需要與芯片制造廠商緊密合作,共同研發(fā)新的封裝工藝。

在這個(gè)過(guò)程中,如何保證高良品率是關(guān)鍵。因?yàn)殡S著制造復(fù)雜度的提升,不良品出現(xiàn)的概率也會(huì)增加。這可能需要在生產(chǎn)流程中引入更精密的檢測(cè)設(shè)備和方法,從芯片原材料的篩選到每一道生產(chǎn)工序都進(jìn)行嚴(yán)格的質(zhì)量把控,以確保最終產(chǎn)品能夠達(dá)到預(yù)期的性能和可靠性標(biāo)準(zhǔn)。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。