多核SoC的異構(gòu)計(jì)算架構(gòu)，ARM DynamIQ到RISC-V大小核的能效比優(yōu)化

時(shí)間：2025-06-12 09:04:33

關(guān)鍵字：多核SoC RISC-V

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]移動(dòng)計(jì)算與邊緣AI設(shè)備對(duì)能效與算力雙重需求的驅(qū)動(dòng)下，多核SoC的異構(gòu)計(jì)算架構(gòu)正經(jīng)歷從傳統(tǒng)同構(gòu)到異構(gòu)融合的范式轉(zhuǎn)變。從ARM DynamIQ的動(dòng)態(tài)調(diào)度到RISC-V大小核的能效比優(yōu)化，技術(shù)演進(jìn)的核心在于通過(guò)核心類(lèi)型、電壓頻率與任務(wù)分配的協(xié)同創(chuàng)新，實(shí)現(xiàn)每瓦特算力的指數(shù)級(jí)提升。以高通驍龍8 Gen 3為例，其Hexagon AI引擎通過(guò)異構(gòu)調(diào)度將語(yǔ)音識(shí)別延遲降低36%，而中科藍(lán)訊的RISC-V音頻芯片則以5mW功耗實(shí)現(xiàn)主動(dòng)降噪功能，印證了異構(gòu)計(jì)算在能效比突破中的關(guān)鍵價(jià)值。

移動(dòng)計(jì)算與邊緣AI設(shè)備對(duì)能效與算力雙重需求的驅(qū)動(dòng)下，多核SoC的異構(gòu)計(jì)算架構(gòu)正經(jīng)歷從傳統(tǒng)同構(gòu)到異構(gòu)融合的范式轉(zhuǎn)變。從ARM DynamIQ的動(dòng)態(tài)調(diào)度到RISC-V大小核的能效比優(yōu)化，技術(shù)演進(jìn)的核心在于通過(guò)核心類(lèi)型、電壓頻率與任務(wù)分配的協(xié)同創(chuàng)新，實(shí)現(xiàn)每瓦特算力的指數(shù)級(jí)提升。以高通驍龍8 Gen 3為例，其Hexagon AI引擎通過(guò)異構(gòu)調(diào)度將語(yǔ)音識(shí)別延遲降低36%，而中科藍(lán)訊的RISC-V音頻芯片則以5mW功耗實(shí)現(xiàn)主動(dòng)降噪功能，印證了異構(gòu)計(jì)算在能效比突破中的關(guān)鍵價(jià)值。

ARM DynamIQ：異構(gòu)集群的能效革命

DynamIQ是ARM在big.LITTLE架構(gòu)基礎(chǔ)上推出的異構(gòu)計(jì)算技術(shù)，其核心突破在于打破傳統(tǒng)多核集群的物理界限，將1至14個(gè)異構(gòu)核心集成于單一共享內(nèi)存池中。以聯(lián)發(fā)科天璣9300的APU 790架構(gòu)為例，其INT8引擎與FP16/FP32引擎通過(guò)DynamIQ調(diào)度器實(shí)現(xiàn)動(dòng)態(tài)負(fù)載分配，在Edge Impulse語(yǔ)音分類(lèi)模型中，INT8引擎利用率達(dá)94%，而FP引擎保持休眠狀態(tài)，使能效比提升40%。這種設(shè)計(jì)不僅簡(jiǎn)化了核心間通信延遲，更通過(guò)DSU-120共享單元實(shí)現(xiàn)L3緩存的智能分區(qū)，確保AI推理任務(wù)在低功耗核心上優(yōu)先執(zhí)行。

DynamIQ的能效優(yōu)化體現(xiàn)在三個(gè)層面：其一，通過(guò)核心復(fù)合體設(shè)計(jì)，允許兩個(gè)核心共享浮點(diǎn)單元與L2緩存，使資源利用率提升25%;其二，電源策略單元(PPU)支持核心與L3緩存的獨(dú)立電源域劃分，在視頻解碼場(chǎng)景中可將閑置核心電壓降至0.4V以節(jié)省功耗;其三，Quick Nap功能使L3緩存RAM在休眠狀態(tài)下仍保留關(guān)鍵數(shù)據(jù)，將喚醒延遲壓縮至10μs以?xún)?nèi)。實(shí)驗(yàn)數(shù)據(jù)顯示，基于DynamIQ的SoC在執(zhí)行Transformer模型推理時(shí)，能效比相較傳統(tǒng)big.LITTLE架構(gòu)提升2.3倍。

RISC-V大小核：開(kāi)源架構(gòu)的能效突破

RISC-V憑借模塊化指令集與零授權(quán)費(fèi)優(yōu)勢(shì)，正在異構(gòu)計(jì)算領(lǐng)域掀起能效革命。中科藍(lán)訊的BES2700系列芯片采用雙核RISC-V架構(gòu)，通過(guò)大小核動(dòng)態(tài)切換實(shí)現(xiàn)5mW超低功耗，其核心設(shè)計(jì)包含兩大創(chuàng)新：其一，大核主頻1.2GHz，配備雙精度浮點(diǎn)單元，負(fù)責(zé)實(shí)時(shí)操作系統(tǒng)與復(fù)雜算法;其二，小核主頻200MHz，采用四級(jí)流水線(xiàn)精簡(jiǎn)設(shè)計(jì)，專(zhuān)司傳感器數(shù)據(jù)采集與簡(jiǎn)單濾波。在TWS耳機(jī)應(yīng)用中，該架構(gòu)使待機(jī)功耗降低至傳統(tǒng)ARM架構(gòu)的1/5，同時(shí)保持96kHz音頻采樣率。

RISC-V的能效優(yōu)化源于指令集與架構(gòu)的深度協(xié)同。例如，阿里C930芯片通過(guò)自定義指令擴(kuò)展，將卷積神經(jīng)網(wǎng)絡(luò)(CNN)的MAC操作周期從5個(gè)壓縮至2個(gè)，配合混合鍵合3D封裝技術(shù)，使NPU能效比達(dá)到15TOPS/W。更值得關(guān)注的是，RISC-V的開(kāi)源特性允許開(kāi)發(fā)者針對(duì)特定場(chǎng)景優(yōu)化編譯器：通過(guò)啟用nolibc模式與CFS調(diào)度算法，Linux內(nèi)核在RISC-V上的編譯體積減少30%，而多線(xiàn)程響應(yīng)速度提升18%。這種靈活性使RISC-V在AIoT設(shè)備中的滲透率預(yù)計(jì)于2027年突破25%。

異構(gòu)調(diào)度的技術(shù)挑戰(zhàn)與突破

異構(gòu)計(jì)算架構(gòu)的落地需解決三大核心問(wèn)題：其一，任務(wù)分配的實(shí)時(shí)性。地平線(xiàn)旭日XJ5芯片通過(guò)task dispatcher實(shí)現(xiàn)NPU與CPU的流水線(xiàn)執(zhí)行，在YOLOv7模型推理中，將1080P圖像處理耗時(shí)壓縮至22ms，其關(guān)鍵在于將預(yù)處理、特征提取與結(jié)果輸出分配至不同核心，并通過(guò)共享內(nèi)存池避免數(shù)據(jù)拷貝。其二，跨核心緩存一致性。ARM DynamIQ的窺探控制單元(SCU)通過(guò)自動(dòng)調(diào)整大小的窺探過(guò)濾器，將核心間數(shù)據(jù)同步延遲降低至5ns以?xún)?nèi)，確保AI訓(xùn)練任務(wù)中梯度更新的實(shí)時(shí)性。其三，動(dòng)態(tài)電壓調(diào)節(jié)的精度。高通Hexagon DSP支持10mV步進(jìn)的電壓調(diào)節(jié)，配合片上溫度傳感器，在GPU負(fù)載超過(guò)80%時(shí)自動(dòng)提升電壓50mV以避免過(guò)熱，使設(shè)備在-20℃至85℃環(huán)境下保持穩(wěn)定性能。

新興技術(shù)為異構(gòu)調(diào)度帶來(lái)新可能。例如，RISC-V的DSA緩存機(jī)制允許處理器內(nèi)核直接輪詢(xún)加速器狀態(tài)，將內(nèi)核與DSA的交互延遲從數(shù)百周期降至數(shù)十周期;而ARM的動(dòng)態(tài)時(shí)序校準(zhǔn)電路則通過(guò)調(diào)整預(yù)充電時(shí)間，使HBM3E存儲(chǔ)器在0.8V電壓下仍滿(mǎn)足JEDEC時(shí)序標(biāo)準(zhǔn)。這些創(chuàng)新使異構(gòu)SoC在執(zhí)行智能圖像處理任務(wù)時(shí)，能效比相較傳統(tǒng)架構(gòu)提升3倍以上。

未來(lái)趨勢(shì)：從異構(gòu)協(xié)同到系統(tǒng)級(jí)能效

異構(gòu)計(jì)算架構(gòu)的演進(jìn)正邁向系統(tǒng)級(jí)能效優(yōu)化。在硬件層面，臺(tái)積電N3B工藝將FinFET晶體管的亞閾值擺幅降低至60mV/dec，使RISC-V小核在0.3V電壓下仍能維持1GHz主頻;在軟件層面，Linux 6.11內(nèi)核為RISC-V引入內(nèi)存熱插拔功能，允許動(dòng)態(tài)調(diào)整核心與緩存的電源狀態(tài)，使服務(wù)器集群的空閑功耗降低40%。更值得期待的是，Chiplet技術(shù)與3D封裝將推動(dòng)異構(gòu)SoC的模塊化設(shè)計(jì)：例如，AMD的MI300X芯片通過(guò)堆疊9個(gè)計(jì)算Die與4個(gè)HBM3E內(nèi)存Die，實(shí)現(xiàn)1.5PFLOPS的AI算力，而功耗控制在750W以?xún)?nèi)。

面向未來(lái)，異構(gòu)計(jì)算架構(gòu)將呈現(xiàn)三大趨勢(shì)：其一，核心類(lèi)型的多元化，除CPU、GPU、NPU外，光子處理器與存算一體芯片將逐步集成;其二，能效比的量級(jí)突破，通過(guò)近閾值計(jì)算與量子糾錯(cuò)技術(shù)，使每比特能耗逼近kT量子極限;其三，開(kāi)發(fā)范式的統(tǒng)一化，基于RISC-V的異構(gòu)編程模型將整合OpenCL、SYCL與自定義指令集，使開(kāi)發(fā)者能夠用單一語(yǔ)言調(diào)度CPU、GPU與DSA。這場(chǎng)由異構(gòu)計(jì)算驅(qū)動(dòng)的能效革命，正在重塑智能設(shè)備的底層邏輯，為萬(wàn)物互聯(lián)時(shí)代構(gòu)建起真正的綠色計(jì)算基礎(chǔ)設(shè)施。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

助力RISC-V架構(gòu)全面落地，村田攜先進(jìn)封裝與電容方案亮相2025 Andes RISC-V CON

關(guān)鍵字： RISC-V

[行業(yè)動(dòng)態(tài)]

達(dá)摩院玄鐵發(fā)布最小面積RISC-V處理器E901，單位能效性能提升48%

關(guān)鍵字： RISC-V

[行業(yè)動(dòng)態(tài)]

“香山”實(shí)現(xiàn)業(yè)界首個(gè)高性能開(kāi)源芯片的產(chǎn)品級(jí)交付與首次規(guī)?；瘧?yīng)用

關(guān)鍵字： RISC-V

[劉巖軒]

RISC-V在AI上的天然優(yōu)勢(shì)，以及能走多遠(yuǎn)的關(guān)鍵所在

受生成式 AI 驅(qū)動(dòng)， RISC-V 芯片市場(chǎng)快速發(fā)展。預(yù)計(jì)到2030年，RISC-V SoC出貨量將達(dá)到1618.1億顆，營(yíng)收將達(dá)到927億美元。其中，用于AI加速器的RISC-V SoC出貨量將達(dá)到41億顆，營(yíng)收將達(dá)...

關(guān)鍵字： RISC-V CPU AI CUDA ARM 推理

[劉巖軒]

中國(guó)RISC-V MCU先行者，率先成熟商用并持續(xù)盈利

2017年前后，RISC-V在中國(guó)萌芽，一些RISC-V的先行者便開(kāi)始摸索前行。匆匆數(shù)年過(guò)去，質(zhì)疑不再，掌聲潮起，RISC-V已然成為業(yè)界追逐的焦點(diǎn)。當(dāng)人們興奮地暢想著Arm無(wú)法攻克的高峰將要插上RISC-V的大旗，RI...

關(guān)鍵字： RISC-V MCU 沁恒青稞

[嵌入式分享]

RISC-V虛擬化擴(kuò)展實(shí)踐：KVM在平頭哥C910平臺(tái)的半虛擬化加速

隨著RISC-V架構(gòu)在數(shù)據(jù)中心和邊緣計(jì)算領(lǐng)域的快速滲透，其虛擬化支持能力成為關(guān)鍵技術(shù)瓶頸。平頭哥C910處理器作為首款支持RISC-V虛擬化擴(kuò)展（H-extension）的高性能核心，通過(guò)KVM實(shí)現(xiàn)半虛擬化加速后，虛擬機(jī)...

關(guān)鍵字： RISC-V KVM 平頭哥C910

[嵌入式分享]

RISC-V生態(tài)適配：平頭哥C910自研芯片啟動(dòng)流程與主線(xiàn)內(nèi)核補(bǔ)丁提交全解析

在RISC-V架構(gòu)蓬勃發(fā)展的背景下，平頭哥半導(dǎo)體推出的C910高性能處理器（12nm工藝，3.0GHz主頻）成為國(guó)產(chǎn)芯片的重要突破。本文通過(guò)C910平臺(tái)啟動(dòng)流程解析、關(guān)鍵內(nèi)核補(bǔ)丁開(kāi)發(fā)、主線(xiàn)提交實(shí)戰(zhàn)，完整呈現(xiàn)從芯片適配到社...

關(guān)鍵字： RISC-V 平頭哥C910 自研芯片

[嵌入式分享]

RISC-V開(kāi)源DSP核設(shè)計(jì)，自定義指令擴(kuò)展與生態(tài)構(gòu)建的挑戰(zhàn)與機(jī)遇

全球半導(dǎo)體產(chǎn)業(yè)向開(kāi)源架構(gòu)加速遷移，RISC-V憑借其開(kāi)放、模塊化與可定制化的特性，正成為數(shù)字信號(hào)處理(DSP)領(lǐng)域的重要技術(shù)載體。然而，開(kāi)源DSP核的設(shè)計(jì)不僅需要突破硬件架構(gòu)的創(chuàng)新瓶頸，更需在指令集擴(kuò)展、生態(tài)兼容性及產(chǎn)業(yè)...

關(guān)鍵字： RISC-V 開(kāi)源DSP

[21ic編輯部]

統(tǒng)一的工具鏈實(shí)現(xiàn)跨平臺(tái)兼容性，HighTec編譯器助力RISC-V汽車(chē)MCU快速發(fā)展

編譯器不僅是連接硬件與軟件的橋梁，還直接影響MCU的性能優(yōu)化與功能安全。面對(duì)汽車(chē)行業(yè)對(duì)高可靠性、低功耗和高算力的需求，編譯器需在確保ASIL-D等嚴(yán)格標(biāo)準(zhǔn)的同時(shí)，最大化發(fā)揮RISC-V芯片的潛力。

關(guān)鍵字：車(chē)規(guī)MCU RISC-V 編譯器 HighTec

[21ic編輯部]

開(kāi)源小滿(mǎn)助力RISC-V軟硬協(xié)同生態(tài)：普華基礎(chǔ)軟件深耕汽車(chē)操作系統(tǒng)開(kāi)發(fā)

操作系統(tǒng)與芯片，同為智能汽車(chē)的技術(shù)底座?；仡櫰?chē)操作系統(tǒng)的發(fā)展歷程，1995年德國(guó)汽車(chē)工業(yè)協(xié)會(huì)發(fā)布的OCK標(biāo)準(zhǔn)被視為起點(diǎn)，涵蓋操作系統(tǒng)、通信和裝載管理三大功能模塊。三十年后的今天，OCK的許多核心內(nèi)容依然在AUTOSAR...

關(guān)鍵字：開(kāi)源小滿(mǎn) RISC-V 普華基礎(chǔ)軟件汽車(chē)操作系統(tǒng)