低功耗存儲(chǔ)器設(shè)計(jì),動(dòng)態(tài)電壓頻率調(diào)節(jié)到近閾值計(jì)算
物聯(lián)網(wǎng)設(shè)備與邊緣AI芯片對(duì)毫瓦級(jí)功耗的極致追求,低功耗存儲(chǔ)器設(shè)計(jì)已成為突破能量效率瓶頸的核心戰(zhàn)場(chǎng)。從動(dòng)態(tài)電壓頻率調(diào)節(jié)(DVFS)到近閾值計(jì)算(NTC),存儲(chǔ)器技術(shù)正通過多維度創(chuàng)新,將每比特能耗壓縮至皮焦耳級(jí)。以三星eMRAM為例,其通過NTC技術(shù)將待機(jī)功耗降低至傳統(tǒng)SRAM的1/1000,同時(shí)保持10年數(shù)據(jù)保持能力,印證了低功耗存儲(chǔ)器在延長(zhǎng)設(shè)備續(xù)航中的革命性價(jià)值。
動(dòng)態(tài)電壓頻率調(diào)節(jié):從存儲(chǔ)單元到陣列級(jí)優(yōu)化
DVFS在存儲(chǔ)器設(shè)計(jì)中的應(yīng)用需突破傳統(tǒng)CPU場(chǎng)景的局限。在傳統(tǒng)架構(gòu)中,存儲(chǔ)器電壓調(diào)節(jié)易引發(fā)讀寫錯(cuò)誤與時(shí)序違規(guī)。為解決這一問題,美光LPDDR5X引入陣列級(jí)DVFS,將存儲(chǔ)體(Bank)劃分為獨(dú)立電壓域,通過片上電壓調(diào)節(jié)器實(shí)現(xiàn)0.5V至1.1V的動(dòng)態(tài)調(diào)節(jié)。當(dāng)檢測(cè)到連續(xù)讀取操作時(shí),電壓可在10μs內(nèi)從1.1V降至0.8V,使待機(jī)功耗降低40%;而在突發(fā)寫入時(shí),電壓可瞬間提升至1.1V以確保數(shù)據(jù)完整性。該技術(shù)使智能手機(jī)在視頻播放場(chǎng)景下的存儲(chǔ)器功耗降低35%,續(xù)航時(shí)間延長(zhǎng)1.2小時(shí)。
時(shí)序補(bǔ)償機(jī)制是DVFS落地的關(guān)鍵。SK海力士HBM3E采用動(dòng)態(tài)時(shí)序校準(zhǔn)電路,當(dāng)電壓降低時(shí),通過調(diào)整預(yù)充電時(shí)間與靈敏放大器(SA)的觸發(fā)閾值,補(bǔ)償信號(hào)延遲變化。實(shí)驗(yàn)數(shù)據(jù)顯示,在0.8V工作電壓下,HBM3E的讀寫時(shí)序仍能滿足JEDEC標(biāo)準(zhǔn),且誤碼率低于10^-15。此外,溫度感知電壓調(diào)節(jié)(TVFS)進(jìn)一步優(yōu)化能效,當(dāng)芯片溫度超過60℃時(shí),電壓自動(dòng)提升50mV以補(bǔ)償漏電流增加,使存儲(chǔ)器在-40℃至125℃環(huán)境下保持穩(wěn)定性能。
近閾值計(jì)算:從電路設(shè)計(jì)到架構(gòu)創(chuàng)新
近閾值計(jì)算(NTC)通過將工作電壓降至晶體管閾值電壓附近,實(shí)現(xiàn)能效的指數(shù)級(jí)提升。在65nm CMOS工藝下,傳統(tǒng)存儲(chǔ)器工作電壓為1.2V時(shí),每比特能耗為10pJ;而采用NTC技術(shù)的eFlash存儲(chǔ)器在0.4V電壓下,能耗可降至0.3pJ。然而,NTC面臨兩大挑戰(zhàn):一是工藝偏差導(dǎo)致的電壓-延遲不確定性,二是亞閾值漏電流引發(fā)的數(shù)據(jù)保持失效。
為應(yīng)對(duì)工藝偏差,臺(tái)積電22ULL工藝引入自適應(yīng)體偏置技術(shù),通過動(dòng)態(tài)調(diào)節(jié)NMOS與PMOS的背柵電壓,補(bǔ)償閾值電壓波動(dòng)。在0.4V工作電壓下,該技術(shù)使存儲(chǔ)器良率從65%提升至92%,同時(shí)將讀寫延遲控制在50ns以內(nèi)。針對(duì)數(shù)據(jù)保持問題,IMEC研發(fā)的鐵電場(chǎng)效應(yīng)晶體管(FeFET)存儲(chǔ)器采用HfO2基鐵電材料,在0.3V電壓下實(shí)現(xiàn)10年數(shù)據(jù)保持能力,較傳統(tǒng)浮柵型Flash提升3個(gè)數(shù)量級(jí)。
架構(gòu)層面的創(chuàng)新同樣重要。ARM Corstone-300參考設(shè)計(jì)將NTC存儲(chǔ)器與低功耗處理器集成,通過電壓域隔離實(shí)現(xiàn)動(dòng)態(tài)掉電。當(dāng)處理器進(jìn)入休眠狀態(tài)時(shí),存儲(chǔ)器電壓降至0.3V以節(jié)省功耗;而當(dāng)喚醒信號(hào)到達(dá)時(shí),電壓可在100ns內(nèi)恢復(fù)至0.8V,確保指令執(zhí)行的連續(xù)性。該架構(gòu)使可穿戴設(shè)備的待機(jī)功耗降低至5μW,續(xù)航時(shí)間延長(zhǎng)至30天。
存儲(chǔ)器類型適配:從易失性到非易失性
不同類型存儲(chǔ)器在低功耗設(shè)計(jì)中的策略存在顯著差異。對(duì)于SRAM,NTC技術(shù)面臨讀寫裕度不足的挑戰(zhàn)。英特爾10nm FinFET SRAM通過雙閾值晶體管設(shè)計(jì),將讀寫路徑的閾值電壓降低至0.2V,而保持路徑的閾值電壓維持在0.4V,從而在0.5V電壓下實(shí)現(xiàn)99.99%的讀寫成功率。對(duì)于DRAM,三星LPDDR6采用堆疊式電容與NTC技術(shù),將工作電壓從1.1V降至0.7V,使每比特能耗降低至2pJ,同時(shí)通過片上ECC糾錯(cuò)確保數(shù)據(jù)可靠性。
非易失性存儲(chǔ)器在低功耗領(lǐng)域更具優(yōu)勢(shì)。華邦電子SPI NOR Flash采用NTC與電荷泵技術(shù),在0.9V電壓下實(shí)現(xiàn)100MHz讀取速度,較傳統(tǒng)方案功耗降低60%。而新興的阻變存儲(chǔ)器(RRAM)與相變存儲(chǔ)器(PCM)則通過材料創(chuàng)新突破電壓限制。例如,Crossbar的RRAM在0.3V電壓下實(shí)現(xiàn)10^12次擦寫循環(huán),且寫入能耗僅為0.1pJ/bit,為AIoT設(shè)備提供理想的低功耗存儲(chǔ)方案。
跨層級(jí)協(xié)同:從電路到系統(tǒng)的能效優(yōu)化
低功耗存儲(chǔ)器設(shè)計(jì)需實(shí)現(xiàn)電路、架構(gòu)與系統(tǒng)的跨層級(jí)協(xié)同。在電路層面,IMEC提出的混合信號(hào)糾錯(cuò)電路將模擬信號(hào)處理與數(shù)字邏輯結(jié)合,在0.4V電壓下實(shí)現(xiàn)10^-15的誤碼率,而面積開銷僅為傳統(tǒng)方案的30%。在架構(gòu)層面,RISC-V低功耗擴(kuò)展指令集(Zce)通過壓縮指令編碼與存儲(chǔ)器訪問優(yōu)化,使處理器在訪問NTC存儲(chǔ)器時(shí)的能耗降低25%。
系統(tǒng)層面的創(chuàng)新同樣關(guān)鍵。蘋果M2芯片采用統(tǒng)一內(nèi)存架構(gòu)(UMA),將CPU、GPU與NPU的存儲(chǔ)器訪問整合至HBM3E堆棧,通過動(dòng)態(tài)電壓調(diào)節(jié)與數(shù)據(jù)局部性優(yōu)化,使AI推理任務(wù)的存儲(chǔ)器能耗降低40%。而在數(shù)據(jù)中心場(chǎng)景,微軟Project Olympus服務(wù)器部署的NTC存儲(chǔ)器集群,通過電壓-頻率-溫度的協(xié)同控制,使萬(wàn)億參數(shù)模型訓(xùn)練的能效比提升至15GFLOPS/W。
未來(lái)技術(shù)演進(jìn):從量子存儲(chǔ)到神經(jīng)形態(tài)存儲(chǔ)
面向后摩爾時(shí)代,量子存儲(chǔ)與神經(jīng)形態(tài)存儲(chǔ)為低功耗設(shè)計(jì)開辟新路徑。IBM研發(fā)的量子位存儲(chǔ)器(Qubit Memory)通過超導(dǎo)電路實(shí)現(xiàn)皮秒級(jí)讀寫,且在10mK溫度下保持量子態(tài)100μs,較傳統(tǒng)方案提升100倍。而英特爾Loihi 3神經(jīng)擬態(tài)芯片則采用憶阻器(Memristor)陣列,在0.2V電壓下實(shí)現(xiàn)突觸權(quán)重的動(dòng)態(tài)更新,使類腦計(jì)算的能效比達(dá)到100TOPS/W。
生物啟發(fā)的存儲(chǔ)器架構(gòu)同樣值得關(guān)注。MIT團(tuán)隊(duì)研發(fā)的DNA存儲(chǔ)芯片通過電化學(xué)調(diào)控實(shí)現(xiàn)數(shù)據(jù)寫入,在0.1V電壓下實(shí)現(xiàn)10^6次循環(huán)壽命,且密度達(dá)到1EB/cm2,為超低功耗大數(shù)據(jù)存儲(chǔ)提供解決方案。這些前沿技術(shù)預(yù)示著,未來(lái)存儲(chǔ)器將在能耗與性能的博弈中實(shí)現(xiàn)質(zhì)的飛躍。
低功耗存儲(chǔ)器設(shè)計(jì)正從DVFS的精準(zhǔn)調(diào)控邁向NTC的能效革命。從電路級(jí)時(shí)序補(bǔ)償?shù)郊軜?gòu)級(jí)動(dòng)態(tài)掉電,從易失性存儲(chǔ)器的NTC適配到非易失性存儲(chǔ)器的材料創(chuàng)新,這場(chǎng)技術(shù)演進(jìn)不僅將延長(zhǎng)設(shè)備的續(xù)航時(shí)間,更將重新定義智能計(jì)算的能量邊界。隨著3D封裝與Chiplet架構(gòu)的普及,未來(lái)存儲(chǔ)器將實(shí)現(xiàn)電壓調(diào)節(jié)的皮秒級(jí)響應(yīng)與能耗的亞皮焦耳級(jí)控制,在萬(wàn)物互聯(lián)時(shí)代構(gòu)建起真正的綠色計(jì)算基礎(chǔ)設(shè)施。這場(chǎng)由低功耗存儲(chǔ)器驅(qū)動(dòng)的能效革命,正在為人類社會(huì)的可持續(xù)發(fā)展注入新的動(dòng)力。