正在閱讀:

瞄準存內計算未來,新型存儲器ReRAM走紅半導體頂會

掃一掃下載界面新聞APP

瞄準存內計算未來,新型存儲器ReRAM走紅半導體頂會

基于ReRAM的芯片功耗低、存內計算速度快,有助于突破類腦計算。

文|芯東西

編譯|張昀

芯東西3月28日消息,據EE Times ASIA 3月24日報道,ReRAM(可變電阻式存儲器)的特性使其在人工智能、存內計算和旨在模仿人腦的應用程序中具有顯著優(yōu)勢,成為下一代內存的主要競爭者。

ReRAM是電阻式隨機存取存儲器,它可以將DRAM(動態(tài)隨機存取存儲器)的讀寫速度與SSD(固態(tài)硬盤)的非易失性結合于一身,功耗更低、讀寫速度更快。ReRAM多用于神經擬態(tài)計算(類腦計算),算力高、功耗低;但它還未完全成熟,也面臨著相變存儲器(PCM)和鐵電隨機存取存儲器(FRAM)等其他存儲器的競爭。

一、“潛力股”ReRAM:可提供高密度非易失性存儲和高效存內計算

ReRAM多用于類腦計算,甚至成為了類腦計算的代名詞。密歇根大學教授Wei D.Lu稱,因為ReRAM可以自己執(zhí)行學習和推理功能,所以ReRAM陣列應用在存內計算架構時很有潛力。ReRAM還支持雙向數據流,而更大的神經網絡使用具有平鋪MPU架構的模塊化系統(tǒng)來提高吞吐量。

去年,電子領域頂會IEDM(國際電子器件大會)匯集了有關推進各種內存類型的最新研究論文,很多人都致力于研究如何改進存內計算、人工智能、機器學習以及類腦計算。

美國密歇根大學至少十年前就已經開始開發(fā)ReRAM原型了。該大學電氣工程和計算機科學系教授Wei D.Lu說道,ReRAM具有提供高密度非易失性存儲以及高效存內計算的潛力,而且支持ReRAM的加速器能夠突破馮·諾伊曼計算架構的瓶頸。教授Wei D.Lu在IEDM發(fā)言時概述了一些器件,講了通過并行計算來處理大的AI模型,還談到了邊緣計算應用程序的功率、延遲和成本問題。ReRAM還能支持雙向數據流,有更好促進存內計算的潛力。

目前,具備并行計算能力的CPU在內存方面仍會遇見問題。雖然GPU可以允許更快的內存訪問,但教授Wei D.Lu稱,需要一種從根本上提高吞吐量和計算效率的新計算架構。內存保護單元(MPU)可以顯著提高并行性,還能將內存與邏輯放在一起,從而實現設備級計算并更好地促進存內計算。

二、ReRAM仍面挑戰(zhàn),PCM也可改善存內技術

教授Wei D.Lu稱ReRAM器件還未成熟,它還面臨三個關鍵挑戰(zhàn):一是基于高精度模數轉換器的讀出電路;二是器件的非理想性,包括受單元間變化的器件的影響;三是ReRAM設備中非線性的以及不對稱電導更新后會嚴重降低訓練的準確度。

三個挑戰(zhàn)有各自的解決方案。第一個挑戰(zhàn)的解決方案包括使用多范圍量化和二元神經網絡。教授Wei D.Lu稱,解決第二個挑戰(zhàn)可以使用2T2R架構實現二進制權重或者采用有架構意識的培訓,這也有助于應對第三個挑戰(zhàn)?;旌暇扔柧毧梢酝ㄟ^較低精度格式訓練大型神經網絡,來提升性能和計算,這也可以解決第二個和第三個挑戰(zhàn)。

除此之外,PCM也能改進存內計算。IBM歐洲研究室(研究中心)一直在探索使用PCM來解決模擬存內計算的溫度敏感性問題。IBM Research存內計算小組成員Irem Boybat說道,隨著人工智能神經網絡的蓬勃發(fā)展,計算機的計算效率問題還有待解決。深度學習是計算密集型的,如果人工智能要可持續(xù)發(fā)展,就必須采用顛覆性的新計算機范式。

Boybat還說道,語言模型的規(guī)模呈指數級增長。根據他的說法,大量數據會從內存?zhèn)鬏數教幚韱卧?,這種情況不僅會加大傳輸成本,而且會留下大量碳足跡。

模擬存內計算通過在內存執(zhí)行某些計算任務來模糊內存和處理之間的界限,并通過內存設備的物理屬性來實現。Boybat說道,PCM能夠以非常密集的方式存儲信息并且其消耗的靜態(tài)功率可以忽略不計。過去一年內,IBM Research公開了兩款基于PCM的存內計算芯片,展示了基于PCM的存內計算潛力。

IBM Research存內計算小組還研究了“蘑菇型”結構(mushroom-type)PCM的溫度敏感性。另外,根據放置在芯片下方的電阻加熱器及其溫度,預計芯片在30攝氏度到80攝氏度范圍內不會出現滯留問題。

IBM Research的實驗研究了溫度變化和漂移對用于存內計算的多級PCM的影響。在IBM Research AI Hardware Center(IBM研究院AI硬件中心)的支持下,IBM Research的研究團隊發(fā)現,盡管PCM表現出與電導相關的溫度敏感性,但在電導狀態(tài)應用的時間-溫度曲線中,其歸一化分布保持相對恒定。該研究團隊還開發(fā)了一個可靠的統(tǒng)計模型來探究溫度對漂移和電導的影響,并根據PCM電導測量對其進行驗證。

該研究團隊使用超一百萬個PCM設備證明:在33攝氏度到80攝氏度的環(huán)境溫度變化下,用簡單的補償方案有可能實現并保持各種網絡的高推斷精度。

三、基于ReRAM的類腦計算:速度每三個月翻一番

人工智能計算的使用增加使得受大腦啟發(fā)的硬件對于人工智能的發(fā)展至關重要。以Liu Ming為代表的中科院微電子研究所和復旦大學的研究人員們介紹稱,人工智能計算使用速度推動了基于ReRAM的類腦計算(BIC)工作。實現類腦計算的方式包括存內計算和神經擬態(tài)計算。

Liu Ming說道,基于ReRAM的類腦計算速度每三個月就可以翻一番。新的存內技術可以在短期內增強現有的層次結構,但是類腦計算能在中長期突破馮·諾伊曼計算架構瓶頸。

類腦計算模型包括人工神經網絡(ANN)和脈沖神經網絡(SNN)等不同的神經網絡模型。其中,ANN能夠處理空間域中的連續(xù)信號;SNN模仿了大腦的工作方式,更具生物可能性。Liu Ming稱,ReRAM具有豐富的開關動態(tài),可以支持大規(guī)模集成、低功耗外圍設備和用于構建類腦計算芯片和系統(tǒng)的特定應用架構,為類腦計算提供了一個理想的平臺。

ReRAM SNN將事件驅動表示并集成了多核結合的芯片,其計算密度高、能效高,能為高性能計算提供潛力,在低功耗下執(zhí)行的芯片將成為現實。Liu Ming說道,在許多其他機構從模擬存內計算開始進行了十多年的研究之后,集成SNN多核將很快實現。然而,如果要開發(fā)適用于實際應用的類腦計算芯片,研究人員在架構層面仍有許多探索工作要做。

因此ReRAM在人工智能和類腦計算應用方面有著很大的潛力,不過它還面臨著FRAM的競爭。IEDM同樣關注磁阻隨機存取存儲器,2021年的IEDM中,有一整天關于磁阻隨機存取存儲器的會議和兩個IEEE Magnetics Society(IEEE磁學會)的活動。

法國原子能委員會電子與信息技術實驗室CEA-Leti,演示了世界上第一個基于FRAM的130nm 16-kbit陣列,并期望其商業(yè)化。超低功耗、高速、高耐用性且與CMOS兼容的BEOL FRAM存儲器使用基于HfO2(二氧化鉿)的新型鐵電材料,該材料不含鉛,比PZT(鋯鈦酸鉛壓電陶瓷)更環(huán)保。

FRAM的例子包括嵌入式應用程序,例如物聯(lián)網設備和可穿戴設備。這項工作得到了歐盟3eFERRO聯(lián)盟項目的支持,該項目旨在生產新的鐵電材料,使FRAM成為物聯(lián)網應用中具有競爭力的非易失性存儲器候選者。

此外,盡管許多IEDM研究論文傾向于在人工智能、類腦計算和存內計算等前沿應用中使用新興存儲器,但推進現有存儲器(如動態(tài)隨機存取存儲器)仍然是許多研究人員的重點。

在IEDM上,英特爾發(fā)表了多篇論文,包括規(guī)模改進和為芯片帶來新功能。英特爾圍繞混合鍵合互連的設計、工藝和組裝挑戰(zhàn),提出了將封裝互連密度提高10倍以上的目標。2021年7月,英特爾宣布推出Foveros Direct,它支持10μm以下的凸塊間距,從而使3D堆疊的互連密度數量級提高。

IEDM的部分論文還探討了英特爾如何通過堆疊多個CMOS晶體管的方法來應對預期的后FinFET時代,該方法旨在通過每平方毫米集成更多晶體管來實現30%到50%的邏輯擴展改進,以繼續(xù)推進摩爾定律。推進摩爾定律的另一項努力包括研究利用僅有幾個原子厚的新型材料,來制造克服傳統(tǒng)硅通道限制的晶體管——使芯片單位面積增加數百萬個晶體管,從而推動即將到來的“埃米時代”。

英特爾還概述了一項新研究:通過在300mm晶圓上集成基于GAN的電源開關與基于硅的CMOS,研究硅的新功能,這將實現CPU的低損耗、高速供電,同時減少主板組件和空間。這樣新的先進封裝和制造工藝或許會幫助現有存儲器在人工智能等新興應用上,釋放新的發(fā)展?jié)摿Α?/p>

結語:ReRAM仍面臨競爭

ReRAM作為當前類腦計算的主要載體,它在高密度非易失性存儲以及存內計算方面都有很大優(yōu)勢?;赗eRAM的類腦計算還能在中長期突破馮·諾伊曼計算架構瓶頸,它支持多種不同的AI算法,具有算力高、功耗低的特點。

但同時,ReRAM并不完全成熟,它仍有器件非理想性、基于高精度模數轉換器的讀出電路等構成的問題;它還面臨著PCM、FRAM的競爭。

來源:EE Times ASIA

本文為轉載內容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

瞄準存內計算未來,新型存儲器ReRAM走紅半導體頂會

基于ReRAM的芯片功耗低、存內計算速度快,有助于突破類腦計算。

文|芯東西

編譯|張昀

芯東西3月28日消息,據EE Times ASIA 3月24日報道,ReRAM(可變電阻式存儲器)的特性使其在人工智能、存內計算和旨在模仿人腦的應用程序中具有顯著優(yōu)勢,成為下一代內存的主要競爭者。

ReRAM是電阻式隨機存取存儲器,它可以將DRAM(動態(tài)隨機存取存儲器)的讀寫速度與SSD(固態(tài)硬盤)的非易失性結合于一身,功耗更低、讀寫速度更快。ReRAM多用于神經擬態(tài)計算(類腦計算),算力高、功耗低;但它還未完全成熟,也面臨著相變存儲器(PCM)和鐵電隨機存取存儲器(FRAM)等其他存儲器的競爭。

一、“潛力股”ReRAM:可提供高密度非易失性存儲和高效存內計算

ReRAM多用于類腦計算,甚至成為了類腦計算的代名詞。密歇根大學教授Wei D.Lu稱,因為ReRAM可以自己執(zhí)行學習和推理功能,所以ReRAM陣列應用在存內計算架構時很有潛力。ReRAM還支持雙向數據流,而更大的神經網絡使用具有平鋪MPU架構的模塊化系統(tǒng)來提高吞吐量。

去年,電子領域頂會IEDM(國際電子器件大會)匯集了有關推進各種內存類型的最新研究論文,很多人都致力于研究如何改進存內計算、人工智能、機器學習以及類腦計算。

美國密歇根大學至少十年前就已經開始開發(fā)ReRAM原型了。該大學電氣工程和計算機科學系教授Wei D.Lu說道,ReRAM具有提供高密度非易失性存儲以及高效存內計算的潛力,而且支持ReRAM的加速器能夠突破馮·諾伊曼計算架構的瓶頸。教授Wei D.Lu在IEDM發(fā)言時概述了一些器件,講了通過并行計算來處理大的AI模型,還談到了邊緣計算應用程序的功率、延遲和成本問題。ReRAM還能支持雙向數據流,有更好促進存內計算的潛力。

目前,具備并行計算能力的CPU在內存方面仍會遇見問題。雖然GPU可以允許更快的內存訪問,但教授Wei D.Lu稱,需要一種從根本上提高吞吐量和計算效率的新計算架構。內存保護單元(MPU)可以顯著提高并行性,還能將內存與邏輯放在一起,從而實現設備級計算并更好地促進存內計算。

二、ReRAM仍面挑戰(zhàn),PCM也可改善存內技術

教授Wei D.Lu稱ReRAM器件還未成熟,它還面臨三個關鍵挑戰(zhàn):一是基于高精度模數轉換器的讀出電路;二是器件的非理想性,包括受單元間變化的器件的影響;三是ReRAM設備中非線性的以及不對稱電導更新后會嚴重降低訓練的準確度。

三個挑戰(zhàn)有各自的解決方案。第一個挑戰(zhàn)的解決方案包括使用多范圍量化和二元神經網絡。教授Wei D.Lu稱,解決第二個挑戰(zhàn)可以使用2T2R架構實現二進制權重或者采用有架構意識的培訓,這也有助于應對第三個挑戰(zhàn)。混合精度訓練可以通過較低精度格式訓練大型神經網絡,來提升性能和計算,這也可以解決第二個和第三個挑戰(zhàn)。

除此之外,PCM也能改進存內計算。IBM歐洲研究室(研究中心)一直在探索使用PCM來解決模擬存內計算的溫度敏感性問題。IBM Research存內計算小組成員Irem Boybat說道,隨著人工智能神經網絡的蓬勃發(fā)展,計算機的計算效率問題還有待解決。深度學習是計算密集型的,如果人工智能要可持續(xù)發(fā)展,就必須采用顛覆性的新計算機范式。

Boybat還說道,語言模型的規(guī)模呈指數級增長。根據他的說法,大量數據會從內存?zhèn)鬏數教幚韱卧?,這種情況不僅會加大傳輸成本,而且會留下大量碳足跡。

模擬存內計算通過在內存執(zhí)行某些計算任務來模糊內存和處理之間的界限,并通過內存設備的物理屬性來實現。Boybat說道,PCM能夠以非常密集的方式存儲信息并且其消耗的靜態(tài)功率可以忽略不計。過去一年內,IBM Research公開了兩款基于PCM的存內計算芯片,展示了基于PCM的存內計算潛力。

IBM Research存內計算小組還研究了“蘑菇型”結構(mushroom-type)PCM的溫度敏感性。另外,根據放置在芯片下方的電阻加熱器及其溫度,預計芯片在30攝氏度到80攝氏度范圍內不會出現滯留問題。

IBM Research的實驗研究了溫度變化和漂移對用于存內計算的多級PCM的影響。在IBM Research AI Hardware Center(IBM研究院AI硬件中心)的支持下,IBM Research的研究團隊發(fā)現,盡管PCM表現出與電導相關的溫度敏感性,但在電導狀態(tài)應用的時間-溫度曲線中,其歸一化分布保持相對恒定。該研究團隊還開發(fā)了一個可靠的統(tǒng)計模型來探究溫度對漂移和電導的影響,并根據PCM電導測量對其進行驗證。

該研究團隊使用超一百萬個PCM設備證明:在33攝氏度到80攝氏度的環(huán)境溫度變化下,用簡單的補償方案有可能實現并保持各種網絡的高推斷精度。

三、基于ReRAM的類腦計算:速度每三個月翻一番

人工智能計算的使用增加使得受大腦啟發(fā)的硬件對于人工智能的發(fā)展至關重要。以Liu Ming為代表的中科院微電子研究所和復旦大學的研究人員們介紹稱,人工智能計算使用速度推動了基于ReRAM的類腦計算(BIC)工作。實現類腦計算的方式包括存內計算和神經擬態(tài)計算。

Liu Ming說道,基于ReRAM的類腦計算速度每三個月就可以翻一番。新的存內技術可以在短期內增強現有的層次結構,但是類腦計算能在中長期突破馮·諾伊曼計算架構瓶頸。

類腦計算模型包括人工神經網絡(ANN)和脈沖神經網絡(SNN)等不同的神經網絡模型。其中,ANN能夠處理空間域中的連續(xù)信號;SNN模仿了大腦的工作方式,更具生物可能性。Liu Ming稱,ReRAM具有豐富的開關動態(tài),可以支持大規(guī)模集成、低功耗外圍設備和用于構建類腦計算芯片和系統(tǒng)的特定應用架構,為類腦計算提供了一個理想的平臺。

ReRAM SNN將事件驅動表示并集成了多核結合的芯片,其計算密度高、能效高,能為高性能計算提供潛力,在低功耗下執(zhí)行的芯片將成為現實。Liu Ming說道,在許多其他機構從模擬存內計算開始進行了十多年的研究之后,集成SNN多核將很快實現。然而,如果要開發(fā)適用于實際應用的類腦計算芯片,研究人員在架構層面仍有許多探索工作要做。

因此ReRAM在人工智能和類腦計算應用方面有著很大的潛力,不過它還面臨著FRAM的競爭。IEDM同樣關注磁阻隨機存取存儲器,2021年的IEDM中,有一整天關于磁阻隨機存取存儲器的會議和兩個IEEE Magnetics Society(IEEE磁學會)的活動。

法國原子能委員會電子與信息技術實驗室CEA-Leti,演示了世界上第一個基于FRAM的130nm 16-kbit陣列,并期望其商業(yè)化。超低功耗、高速、高耐用性且與CMOS兼容的BEOL FRAM存儲器使用基于HfO2(二氧化鉿)的新型鐵電材料,該材料不含鉛,比PZT(鋯鈦酸鉛壓電陶瓷)更環(huán)保。

FRAM的例子包括嵌入式應用程序,例如物聯(lián)網設備和可穿戴設備。這項工作得到了歐盟3eFERRO聯(lián)盟項目的支持,該項目旨在生產新的鐵電材料,使FRAM成為物聯(lián)網應用中具有競爭力的非易失性存儲器候選者。

此外,盡管許多IEDM研究論文傾向于在人工智能、類腦計算和存內計算等前沿應用中使用新興存儲器,但推進現有存儲器(如動態(tài)隨機存取存儲器)仍然是許多研究人員的重點。

在IEDM上,英特爾發(fā)表了多篇論文,包括規(guī)模改進和為芯片帶來新功能。英特爾圍繞混合鍵合互連的設計、工藝和組裝挑戰(zhàn),提出了將封裝互連密度提高10倍以上的目標。2021年7月,英特爾宣布推出Foveros Direct,它支持10μm以下的凸塊間距,從而使3D堆疊的互連密度數量級提高。

IEDM的部分論文還探討了英特爾如何通過堆疊多個CMOS晶體管的方法來應對預期的后FinFET時代,該方法旨在通過每平方毫米集成更多晶體管來實現30%到50%的邏輯擴展改進,以繼續(xù)推進摩爾定律。推進摩爾定律的另一項努力包括研究利用僅有幾個原子厚的新型材料,來制造克服傳統(tǒng)硅通道限制的晶體管——使芯片單位面積增加數百萬個晶體管,從而推動即將到來的“埃米時代”。

英特爾還概述了一項新研究:通過在300mm晶圓上集成基于GAN的電源開關與基于硅的CMOS,研究硅的新功能,這將實現CPU的低損耗、高速供電,同時減少主板組件和空間。這樣新的先進封裝和制造工藝或許會幫助現有存儲器在人工智能等新興應用上,釋放新的發(fā)展?jié)摿Α?/p>

結語:ReRAM仍面臨競爭

ReRAM作為當前類腦計算的主要載體,它在高密度非易失性存儲以及存內計算方面都有很大優(yōu)勢?;赗eRAM的類腦計算還能在中長期突破馮·諾伊曼計算架構瓶頸,它支持多種不同的AI算法,具有算力高、功耗低的特點。

但同時,ReRAM并不完全成熟,它仍有器件非理想性、基于高精度模數轉換器的讀出電路等構成的問題;它還面臨著PCM、FRAM的競爭。

來源:EE Times ASIA

本文為轉載內容,授權事宜請聯(lián)系原著作權人。