RISC-V CPU進入CUDA,還需要解決哪些挑戰(zhàn)?
現(xiàn)在CUDA只在x86和Arm架構(gòu)CPU上得以部署,但英偉達正在將其移植到RISC-V架構(gòu)的CPU上。
“其實我們不在乎CPU具體是什么。無論是x86、Arm或者是RISC-V,我們其實都能夠兼容這些?!庇ミ_副總裁 Frans Sijstermanns在第五屆RISC-V中國峰會上談到。
推進CUDA向RISC-V CPU移植
英偉達與RISC-V的淵源由來已久。2017年首屆RISC-V工作坊由上海交通大學與英偉達聯(lián)合主辦,這次工作坊也是全球第六屆RISC-V研討會,主題聚焦于在微控制器(MCU)中嵌入RISC-V。當時尚未有RISC-V產(chǎn)品發(fā)布,但英偉達已看到其潛力。八年后,英偉達在集成MCU產(chǎn)品中已出貨超過10億顆RISC-V芯片,取得了顯著成功。
Frans Sijstermanns介紹了英偉達將并行計算平臺CUDA移植到RISC-V架構(gòu)的進展。CUDA作為C和C++語言的擴展,傳統(tǒng)上在x86和Arm平臺上運行。英偉達現(xiàn)正積極將CUDA擴展至RISC-V,旨在充分發(fā)揮其作為關(guān)鍵應用處理器的潛力。
CUDA包括兩個主要組成部分:工具箱(Toolkit)和驅(qū)動程序。CUDA工具箱類似編譯器,目前正進行RISC-V的移植工作,以實現(xiàn)編譯和運行。
Frans Sijstermanns通過圖表展示了完整應用運行時環(huán)境,包括應用軟件、第三方軟件和PyTorch等操作系統(tǒng)。核心組件如CUDA KMD(內(nèi)核模式驅(qū)動)和CUDA UMD(用戶模式驅(qū)動)正在適配RISC-V。此外,第三方和應用軟件也需進行移植以確保兼容性。
Frans Sijstermanns強調(diào)了CUDA庫在各行業(yè)中的重要性。例如,英偉達的FT庫可加速推理,其他庫則支持數(shù)據(jù)分析和芯片制造。英偉達在過去20年中開發(fā)了900多個庫,旨在通過RISC-V落地這些資源,加速行業(yè)創(chuàng)新和技術(shù)迭代。這些庫對推動不同領(lǐng)域的技術(shù)發(fā)展至關(guān)重要。
RISC-V CPU進入CUDA,還需要解決哪些挑戰(zhàn)?
Frans Sijstermanns指出,RISC-V生態(tài)系統(tǒng)近年來取得長足進展。自2022年以來,至2025年已有至少10項新規(guī)范獲得批準,其中包括關(guān)鍵的RVA23和服務(wù)器系統(tǒng)芯片(SoC)標準。RISC-V國際基金會官網(wǎng)列出了75個已在RISC-V上運行的軟件包,包括Linux、工具鏈、數(shù)據(jù)庫和虛擬機。然而,這些軟件包仍需進一步優(yōu)化和補丁支持。
雖然已經(jīng)有了很大的推進,然而,將RISC-V CPU引入CUDA仍存在一些挑戰(zhàn):規(guī)格方面,服務(wù)器平臺規(guī)格、性能事件、內(nèi)存標記、機密虛擬機和矩陣尚在開發(fā)中;軟件方面,優(yōu)化、成熟度及更高層次的應用堆棧有待改進;主機CPU方面,缺乏RVA23合規(guī)主機CPU、AIA中斷、IOMMU、虛擬機監(jiān)控器及單核性能仍需提升。一旦生態(tài)系統(tǒng)成熟,標準CUDA發(fā)布將支持符合RISC-V服務(wù)器平臺規(guī)格和Linux操作系統(tǒng)的環(huán)境。
確保CUDA在RISC-V上的板卡可用性和兼容性是當下的首要任務(wù)。例如,英偉達已使用阿里巴巴的C920處理器,但其尚未符合RVA23或新批準的SoC標準。統(tǒng)一的虛擬內(nèi)存對于實現(xiàn)CPU與GPU之間的數(shù)據(jù)共享和一致性至關(guān)重要。Frans Sijstermanns強調(diào)需改進虛擬內(nèi)存管理和板卡設(shè)計,以全面支持RVA23規(guī)范。
英偉達正與生態(tài)系統(tǒng)合作伙伴密切合作,優(yōu)化CUDA以適配RISC-V,目標是發(fā)布符合服務(wù)器平臺規(guī)范和Linux RISC-V標準的標準化版本。這需要解決系統(tǒng)級問題并確保強大的CPU開發(fā)。Frans Sijstermanns鼓勵RISC-V社區(qū)持續(xù)協(xié)作,共同推動這些進展。
Frans Sijstermanns總結(jié)道,英偉達致力于加速計算,強調(diào)對x86、Arm和RISC-V等CPU架構(gòu)的兼容性。CUDA與RISC-V服務(wù)器的整合,結(jié)合英偉達的通信處理器,旨在提供全面的硬件解決方案。從軟件到硬件的過渡需要與生態(tài)系統(tǒng)伙伴的廣泛協(xié)作以及強大的主機CPU支持。