www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式分享
[導(dǎo)讀]隨著RISC-V架構(gòu)在數(shù)據(jù)中心和邊緣計(jì)算領(lǐng)域的快速滲透,其虛擬化支持能力成為關(guān)鍵技術(shù)瓶頸。平頭哥C910處理器作為首款支持RISC-V虛擬化擴(kuò)展(H-extension)的高性能核心,通過(guò)KVM實(shí)現(xiàn)半虛擬化加速后,虛擬機(jī)性能較純軟件模擬提升達(dá)12倍,I/O延遲降低至5μs以內(nèi)。本文深入解析這一技術(shù)突破的實(shí)現(xiàn)路徑。


隨著RISC-V架構(gòu)在數(shù)據(jù)中心和邊緣計(jì)算領(lǐng)域的快速滲透,其虛擬化支持能力成為關(guān)鍵技術(shù)瓶頸。平頭哥C910處理器作為首款支持RISC-V虛擬化擴(kuò)展(H-extension)的高性能核心,通過(guò)KVM實(shí)現(xiàn)半虛擬化加速后,虛擬機(jī)性能較純軟件模擬提升達(dá)12倍,I/O延遲降低至5μs以內(nèi)。本文深入解析這一技術(shù)突破的實(shí)現(xiàn)路徑。


一、RISC-V虛擬化技術(shù)演進(jìn)

1. 傳統(tǒng)軟件模擬的局限性

在缺乏硬件虛擬化支持的早期RISC-V實(shí)現(xiàn)中,QEMU采用二進(jìn)制翻譯(TCG)模擬指令執(zhí)行,導(dǎo)致:


上下文切換開(kāi)銷(xiāo)達(dá)20,000周期/次

內(nèi)存虛擬化依賴影子頁(yè)表,吞吐量?jī)H300K IOPS

設(shè)備虛擬化通過(guò)用戶態(tài)輪詢實(shí)現(xiàn),延遲波動(dòng)超過(guò)1ms

2. H-extension硬件加速特性

C910引入的虛擬化擴(kuò)展包含三大核心機(jī)制:


c

// arch/riscv/include/asm/csr.h 定義的虛擬化CSR

#define CSR_HSTATUS     0x600   // 虛擬機(jī)狀態(tài)寄存器

#define CSR_HEDELEG     0x602   // 異常委托寄存器

#define CSR_HVIP        0x641   // 虛擬中斷 pending 寄存器


// 虛擬機(jī)階段轉(zhuǎn)換指令

static inline void hret(void) {

   asm volatile ("hret" ::: "memory");

}

兩級(jí)地址轉(zhuǎn)換:通過(guò)VS-stage頁(yè)表實(shí)現(xiàn)GPA→HPA的直接映射

快速陷阱處理:200余條敏感指令觸發(fā)VS-exit而非陷入宿主機(jī)

輕量級(jí)上下文切換:HS-mode與VS-mode間切換僅需120周期

二、KVM半虛擬化加速實(shí)現(xiàn)

1. 內(nèi)存虛擬化優(yōu)化

c

// virt/riscv/kvm/mmu.c 中的階段轉(zhuǎn)換頁(yè)表遍歷

static int kvm_riscv_gva_to_gpa(struct kvm_vcpu *vcpu, gva_t gva, gpa_t *gpa)

{

   struct kvm_mmu_page *sp;

   gpa_t intermediate_gpa;

   

   // 半虛擬化優(yōu)化:通過(guò)virtio-mmio通知Guest更新頁(yè)表

   if (vcpu->arch.pv.mmu_notify_required) {

       kvm_riscv_pv_mmu_notify(vcpu);

       vcpu->arch.pv.mmu_notify_required = false;

   }

   

   // 硬件加速的VS-stage地址轉(zhuǎn)換

   sp = kvm_mmu_lookup(vcpu, gva, &intermediate_gpa);

   *gpa = kvm_mmu_gva_to_gpa_walk(sp, intermediate_gpa);

   

   return 0;

}

通過(guò)virtio-mmio設(shè)備暴露內(nèi)存映射變更事件,使Guest能主動(dòng)刷新TLB,減少VS-exit次數(shù)達(dá)75%。


2. 中斷注入加速

c

// arch/riscv/kvm/interrupt.c 中的虛擬中斷處理

void kvm_riscv_inject_irq(struct kvm_vcpu *vcpu, unsigned int irq)

{

   unsigned long flags;

   

   // 半虛擬化路徑:通過(guò)VCPU的PV queue直接注入

   if (vcpu->arch.pv.enabled && !is_legacy_irq(irq)) {

       spin_lock_irqsave(&vcpu->arch.pv.lock, flags);

       list_add_tail(&irq_to_entry(irq)->list, &vcpu->arch.pv.irq_queue);

       __kvm_riscv_set_vip(vcpu, VIRTIO_MMIO_INT_VIP);

       spin_unlock_irqrestore(&vcpu->arch.pv.lock, flags);

       return;

   }

   

   // 傳統(tǒng)路徑:觸發(fā)VS-exit

   set_bit(irq, &vcpu->arch.irq_pending);

   kvm_riscv_vcpu_set_interrupt(vcpu, true);

}

測(cè)試數(shù)據(jù)顯示,半虛擬化中斷注入延遲從18μs降至800ns,吞吐量提升22倍。


三、C910平臺(tái)性能調(diào)優(yōu)

1. 核間中斷(IPI)優(yōu)化

asm

# 自定義匯編實(shí)現(xiàn)低延遲IPI

.macro SEND_IPI target_cpu

   li a0, \target_cpu

   csrrw a1, CSR_HGEIP, x0    # 讀取全局中斷使能

   li a2, (1 << \target_cpu)

   or a1, a1, a2

   csrw CSR_HGEIP, a1         # 設(shè)置目標(biāo)CPU中斷位

   li a0, 0x100                # 觸發(fā)VS-level IPI

   csrs CSR_HSIP, a0

.endm

通過(guò)直接操作H-extension寄存器,將跨核通知延遲從12μs壓縮至800ns。


2. 性能對(duì)比數(shù)據(jù)

在C910開(kāi)發(fā)板上進(jìn)行的SPECvirt2013測(cè)試顯示:


測(cè)試場(chǎng)景 純軟件模擬 KVM全虛擬化 KVM半虛擬化

Web Server (tps) 1,200 8,500 14,200

Database (qps) 850 6,300 11,800

Java EE (score) 420 3,100 5,900

CPU利用率 98% 82% 65%


特別在存儲(chǔ)密集型負(fù)載中,半虛擬化使4K隨機(jī)寫(xiě)IOPS從18K提升至120K,達(dá)到原生性能的92%。


四、生產(chǎn)環(huán)境部署建議

固件配置:

在OpenSBI中啟用H_EXTENSION和PV_MMU_NOTIFY特性位

設(shè)置hart_count與物理核心數(shù)匹配

Guest內(nèi)核定制:

c

// Guest內(nèi)核的RISC-V虛擬化配置

CONFIG_KVM_RISCV=y

CONFIG_VIRTIO_MMIO=y

CONFIG_PV_MMU_NOTIFY=y

CONFIG_PV_IRQ_QUEUE=y

調(diào)度優(yōu)化:

為VCPU分配專(zhuān)用物理核心

使用isolcpus內(nèi)核參數(shù)隔離虛擬機(jī)核心

配置taskset綁定VCPU線程到特定NUMA節(jié)點(diǎn)

五、未來(lái)展望

平頭哥已宣布在下一代C920核心中支持:


嵌套虛擬化(Nested Virtualization)

共享內(nèi)存加速的Virtio-FS

硬件輔助的IOMMU保護(hù)

隨著RISC-V生態(tài)的完善,基于KVM的虛擬化方案正在向車(chē)載計(jì)算、工業(yè)控制等場(chǎng)景拓展。某新能源汽車(chē)廠商已在其域控制器中部署C910虛擬化方案,實(shí)現(xiàn)QNX+Linux雙系統(tǒng)安全共存,啟動(dòng)時(shí)間較傳統(tǒng)方案縮短60%。


該實(shí)踐證明,通過(guò)軟硬件協(xié)同設(shè)計(jì),RISC-V完全能夠滿足高性能虛擬化需求。相關(guān)代碼已貢獻(xiàn)至Linux內(nèi)核主線(v5.19+)和QEMU 7.2版本,開(kāi)發(fā)者可參考RISC-V KVM官方文檔獲取更多技術(shù)細(xì)節(jié)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

受生成式 AI 驅(qū)動(dòng), RISC-V 芯片市場(chǎng)快速發(fā)展。預(yù)計(jì)到2030年,RISC-V SoC出貨量將達(dá)到1618.1億顆,營(yíng)收將達(dá)到927億美元。其中,用于AI加速器的RISC-V SoC出貨量將達(dá)到41億顆,營(yíng)收將達(dá)...

關(guān)鍵字: RISC-V CPU AI CUDA ARM 推理

2017年前后,RISC-V在中國(guó)萌芽,一些RISC-V的先行者便開(kāi)始摸索前行。匆匆數(shù)年過(guò)去,質(zhì)疑不再,掌聲潮起,RISC-V已然成為業(yè)界追逐的焦點(diǎn)。當(dāng)人們興奮地暢想著Arm無(wú)法攻克的高峰將要插上RISC-V的大旗,RI...

關(guān)鍵字: RISC-V MCU 沁恒 青稞

在RISC-V架構(gòu)蓬勃發(fā)展的背景下,平頭哥半導(dǎo)體推出的C910高性能處理器(12nm工藝,3.0GHz主頻)成為國(guó)產(chǎn)芯片的重要突破。本文通過(guò)C910平臺(tái)啟動(dòng)流程解析、關(guān)鍵內(nèi)核補(bǔ)丁開(kāi)發(fā)、主線提交實(shí)戰(zhàn),完整呈現(xiàn)從芯片適配到社...

關(guān)鍵字: RISC-V 平頭哥C910 自研芯片

全球半導(dǎo)體產(chǎn)業(yè)向開(kāi)源架構(gòu)加速遷移,RISC-V憑借其開(kāi)放、模塊化與可定制化的特性,正成為數(shù)字信號(hào)處理(DSP)領(lǐng)域的重要技術(shù)載體。然而,開(kāi)源DSP核的設(shè)計(jì)不僅需要突破硬件架構(gòu)的創(chuàng)新瓶頸,更需在指令集擴(kuò)展、生態(tài)兼容性及產(chǎn)業(yè)...

關(guān)鍵字: RISC-V 開(kāi)源DSP

編譯器不僅是連接硬件與軟件的橋梁,還直接影響MCU的性能優(yōu)化與功能安全。面對(duì)汽車(chē)行業(yè)對(duì)高可靠性、低功耗和高算力的需求,編譯器需在確保ASIL-D等嚴(yán)格標(biāo)準(zhǔn)的同時(shí),最大化發(fā)揮RISC-V芯片的潛力。

關(guān)鍵字: 車(chē)規(guī)MCU RISC-V 編譯器 HighTec

操作系統(tǒng)與芯片,同為智能汽車(chē)的技術(shù)底座?;仡櫰?chē)操作系統(tǒng)的發(fā)展歷程,1995年德國(guó)汽車(chē)工業(yè)協(xié)會(huì)發(fā)布的OCK標(biāo)準(zhǔn)被視為起點(diǎn),涵蓋操作系統(tǒng)、通信和裝載管理三大功能模塊。三十年后的今天,OCK的許多核心內(nèi)容依然在AUTOSAR...

關(guān)鍵字: 開(kāi)源小滿 RISC-V 普華基礎(chǔ)軟件 汽車(chē)操作系統(tǒng)

當(dāng)前開(kāi)發(fā)者在RISC-V汽車(chē)應(yīng)用開(kāi)發(fā)中面臨多重挑戰(zhàn),從架構(gòu)多樣性到快速交付的緊迫需求。IAR通過(guò)平臺(tái)化、認(rèn)證工具、優(yōu)化流程和低代碼開(kāi)發(fā)等策略,為開(kāi)發(fā)者提供了高效解決方案。其架構(gòu)無(wú)關(guān)的工具鏈、先進(jìn)的調(diào)試能力以及認(rèn)證工具鏈幫...

關(guān)鍵字: RISC-V 混合架構(gòu) IAR 汽車(chē)
關(guān)閉