芯片設(shè)計(jì)上云,AI智算賦能|構(gòu)建從芯片系統(tǒng)設(shè)計(jì)到制造的一站式融合平臺(tái)
當(dāng)前,我國(guó)集成電路產(chǎn)業(yè)面臨諸多嚴(yán)峻挑戰(zhàn),包括國(guó)際競(jìng)爭(zhēng)加劇、技術(shù)封鎖和供應(yīng)鏈限制導(dǎo)致的外部壓力,以及內(nèi)部高端芯片設(shè)計(jì)與制造能力不足、關(guān)鍵設(shè)備和材料依賴進(jìn)口、產(chǎn)業(yè)鏈協(xié)同不足等問(wèn)題。同時(shí),國(guó)內(nèi)市場(chǎng)需求快速增長(zhǎng),供需矛盾突出,芯片自給率較低,加之高端人才短缺和研發(fā)投入不足,進(jìn)一步加劇了發(fā)展難度。
在全球科技競(jìng)爭(zhēng)加劇的背景下,我國(guó)需集中資源攻克“卡脖子”技術(shù),加強(qiáng)產(chǎn)業(yè)鏈上下游協(xié)同,提升高端人才培養(yǎng)與技術(shù)創(chuàng)新能力,推動(dòng)產(chǎn)業(yè)自主化發(fā)展,并通過(guò)國(guó)際合作與市場(chǎng)多元化降低風(fēng)險(xiǎn),構(gòu)建更具韌性的集成電路產(chǎn)業(yè)生態(tài)。
面對(duì)集成電路產(chǎn)業(yè)的諸多挑戰(zhàn),芯片設(shè)計(jì)上云和云平臺(tái)的應(yīng)用正成為破局之道。云平臺(tái)通過(guò)靈活調(diào)用計(jì)算資源、降低成本、提升效率,為芯片設(shè)計(jì)提供了更高效、安全的解決方案,同時(shí)結(jié)合AI調(diào)度優(yōu)化,顯著加速設(shè)計(jì)進(jìn)程。在ICCAD大會(huì)上,速石科技展示了其領(lǐng)先的融合智算研發(fā)平臺(tái),我們也有幸采訪到了速石科技首席技術(shù)官?gòu)埓蟪?,深入探討了這一領(lǐng)域的最新進(jìn)展。
張大成指出,隨著半導(dǎo)體產(chǎn)業(yè)的快速發(fā)展,芯片設(shè)計(jì)正從單一模塊設(shè)計(jì)逐步邁向系統(tǒng)級(jí)設(shè)計(jì)。這一趨勢(shì)對(duì)芯片設(shè)計(jì)企業(yè)提出了更高的要求,尤其是在EDA工具與CAE仿真工具逐步融合的背景下,研發(fā)平臺(tái)的功能和交互方式需要進(jìn)行重大革新。
以往EDA工程師更多專注于數(shù)字設(shè)計(jì)或模擬設(shè)計(jì)的流程,但在新的系統(tǒng)設(shè)計(jì)時(shí)代,設(shè)計(jì)工作需要同時(shí)考慮電磁、結(jié)構(gòu)、電源完整性、功耗完整性等多維度因素。例如,在SOC與Chiplet的2.5D或3D封裝中,結(jié)構(gòu)仿真、電磁仿真和電源仿真等任務(wù)變得尤為重要。這種多學(xué)科融合的設(shè)計(jì)需求,對(duì)傳統(tǒng)的工具流(flow)和設(shè)計(jì)流程提出了巨大挑戰(zhàn)。
今年行業(yè)內(nèi)出現(xiàn)了諸如Snowflake收購(gòu)Streamlit和Cadence收購(gòu)Beta CAE等重要并購(gòu)事件,進(jìn)一步印證了這一融合趨勢(shì)的加速發(fā)展。速石科技敏銳地捕捉到這一行業(yè)變化,并推出了融合型研發(fā)設(shè)計(jì)平臺(tái)。這一平臺(tái)整合了芯片設(shè)計(jì)的前后端仿真、結(jié)構(gòu)仿真和電磁仿真等功能,幫助企業(yè)客戶實(shí)現(xiàn)從芯片到系統(tǒng)的一體化設(shè)計(jì)。
AI智算賦能,提升復(fù)雜仿真效能
在芯片的設(shè)計(jì)研發(fā)過(guò)程中,整個(gè)流程從定義產(chǎn)品的功能需求開(kāi)始,經(jīng)過(guò)一系列的設(shè)計(jì)、驗(yàn)證、仿真、調(diào)試、優(yōu)化,最終實(shí)現(xiàn)高效完成。這其中,結(jié)合速石科技的AI模型調(diào)度和資源管理方案,能夠確保整個(gè)流程更加智能和高效。
首先,整個(gè)研發(fā)流程起始于產(chǎn)品特性SPEC的定義。這個(gè)階段,工程師根據(jù)市場(chǎng)需求和應(yīng)用場(chǎng)景確定芯片的具體功能,比如需要設(shè)計(jì)GPU、CPU、MCU(微控制器)、DPU(數(shù)據(jù)處理單元)等核心模塊,還可能涉及到WIFI、5G通信、藍(lán)牙、存儲(chǔ)卡、激光雷達(dá)、AI控制芯片、顯示控制等關(guān)鍵功能模塊。通過(guò)對(duì)產(chǎn)品功能需求的精確定義,這一步為后續(xù)設(shè)計(jì)提供了清晰的方向。
接下來(lái)進(jìn)入研發(fā)管理階段,這是整個(gè)流程的核心部分。研發(fā)管理環(huán)節(jié)包括多個(gè)技術(shù)復(fù)雜的子流程:
設(shè)計(jì)仿真是第一個(gè)重要環(huán)節(jié),包括模擬、數(shù)字電路的設(shè)計(jì)和射頻仿真,確保芯片在理論上可以實(shí)現(xiàn)所需功能。這一步依賴于一系列高精度設(shè)計(jì)工具,比如Virtuoso、Verdi、SpyGlass等,這些工具幫助工程師優(yōu)化電路設(shè)計(jì)、檢查邏輯錯(cuò)誤。
隨后是制造仿真,這是從芯片設(shè)計(jì)到物理實(shí)現(xiàn)的關(guān)鍵環(huán)節(jié)。工程師會(huì)進(jìn)行物理建模、電磁場(chǎng)分析、結(jié)構(gòu)力學(xué)分析,以及多物理場(chǎng)的綜合分析,確保設(shè)計(jì)可以在實(shí)際的制造環(huán)境中實(shí)現(xiàn)。這一過(guò)程中,工具如CST、HFSS、COMSOL等被廣泛應(yīng)用,用于分析復(fù)雜的熱、力學(xué)、電磁性能等。
在整個(gè)研發(fā)管理階段,反復(fù)迭代、優(yōu)化是關(guān)鍵,確保設(shè)計(jì)滿足SPEC定義的所有要求。
由于研發(fā)流程中的計(jì)算任務(wù)極其復(fù)雜,特別是在仿真階段需要消耗大量計(jì)算資源,這時(shí)速石科技提供的AI計(jì)算優(yōu)化模型就派上用場(chǎng)了。速石科技通過(guò)一套專用的AI調(diào)度框架,實(shí)現(xiàn)研發(fā)任務(wù)的智能管理和資源優(yōu)化。
“這個(gè)過(guò)程里面就是有一個(gè)自主訓(xùn)練的AI模型,跟EDA工具緊密結(jié)合。我們可以去學(xué)習(xí)他們的歷史仿真任務(wù)和作業(yè)特性、任務(wù)的特性和產(chǎn)品類型的數(shù)據(jù),編譯成他們自己的模型,這個(gè)模型會(huì)應(yīng)用到他們自己的研發(fā)平臺(tái)里面,幫他們從頂端,設(shè)計(jì)源頭告訴他們,你今天設(shè)計(jì)一個(gè)simulation,你做仿真的話,不需要再看這邊多少機(jī)器資源,多少CPU,多少核可以用,完全不需要?!睆埓蟪山忉尩剑捌鋵?shí)從底層的角度來(lái)看的話,我們還可以增加異構(gòu)資源的一些管理,比如GPU卡,結(jié)合一些機(jī)器作為服務(wù)器,再結(jié)合速石科技的國(guó)產(chǎn)變速器,提供完整的解決方案,那AI這塊兒就是在其中和EDA工具和業(yè)務(wù)的屬性緊密結(jié)合的模式?!?
據(jù)悉,速石的AI模型調(diào)度系統(tǒng)接入研發(fā)流程后,利用MLOps平臺(tái)不斷學(xué)習(xí)和優(yōu)化模型,并將優(yōu)化后的模型用于研發(fā)計(jì)算中的任務(wù)調(diào)度。這個(gè)調(diào)度系統(tǒng)主要由以下幾個(gè)部分組成:
· 首先是Fsched資源配置,它能夠智能地分配CPU、GPU、內(nèi)存等計(jì)算資源,確保計(jì)算任務(wù)始終能夠高效運(yùn)行。
· 隨后,F(xiàn)sched任務(wù)調(diào)度實(shí)時(shí)調(diào)整任務(wù)的優(yōu)先級(jí),根據(jù)不同任務(wù)的重要性和資源需求靈活安排。
· 最后是Fsched任務(wù)監(jiān)控,實(shí)時(shí)跟蹤任務(wù)的狀態(tài),發(fā)現(xiàn)和解決運(yùn)行中的瓶頸問(wèn)題。
這些調(diào)度能力背后,依托于龐大的計(jì)算資源池,包括計(jì)算隊(duì)列、CPU核心、GPU卡、內(nèi)存以及硬件仿真器等,甚至可以靈活調(diào)用混合云計(jì)算的資源。這樣,研發(fā)團(tuán)隊(duì)可以專注于芯片設(shè)計(jì)本身,而無(wú)需擔(dān)心計(jì)算資源不足或調(diào)度效率低的問(wèn)題。
最終,這套系統(tǒng)讓整個(gè)研發(fā)流程從定義產(chǎn)品到完成驗(yàn)證的每一步都更加智能化和高效。通過(guò)優(yōu)化資源分配、提升計(jì)算效率,速石科技的方案不僅加速了芯片研發(fā)進(jìn)程,還顯著降低了計(jì)算成本,為研發(fā)團(tuán)隊(duì)節(jié)省了時(shí)間和資金。
芯片上云的現(xiàn)狀與未來(lái):從“熱度高漲”到“務(wù)實(shí)需求”
在芯片設(shè)計(jì)復(fù)雜度不斷提升、研發(fā)成本居高不下的背景下,云仿真逐漸成為推動(dòng)行業(yè)創(chuàng)新的重要技術(shù)手段。當(dāng)前,盡管中國(guó)IC設(shè)計(jì)企業(yè)的整體數(shù)量未達(dá)預(yù)期,但對(duì)高精度設(shè)計(jì)和復(fù)雜研發(fā)的需求依然旺盛。特別是創(chuàng)新型IC設(shè)計(jì)公司,面臨巨大的資源壓力,如何以最小的投入完成高性能芯片的開(kāi)發(fā),成為關(guān)鍵問(wèn)題。
近年來(lái),云平臺(tái)的使用模式也發(fā)生了顯著變化。2021至2022年是芯片設(shè)計(jì)公司上云的高峰期,但經(jīng)濟(jì)環(huán)境的變化使企業(yè)的云計(jì)算使用從“高熱度”轉(zhuǎn)向“務(wù)實(shí)化”。如今,云仿真更多被用于解決突發(fā)性和緊急性的計(jì)算需求,通過(guò)靈活調(diào)用資源,企業(yè)能夠以更低的成本快速完成仿真任務(wù),并在緊迫的研發(fā)進(jìn)度中獲得及時(shí)反饋。張大成提到:“未來(lái),云仿真的應(yīng)用會(huì)更加務(wù)實(shí),企業(yè)會(huì)專注于用云解決突發(fā)的高需求場(chǎng)景,以提升效率的同時(shí)嚴(yán)格控制成本?!?
此外,芯片設(shè)計(jì)中日益增長(zhǎng)的計(jì)算需求也催生了混合云架構(gòu)的興起。單機(jī)仿真能力已經(jīng)無(wú)法滿足大規(guī)模仿真任務(wù)的要求,而速石科技提出的混合云解決方案實(shí)現(xiàn)了本地平臺(tái)與云端資源的無(wú)縫銜接。這一架構(gòu)不僅能動(dòng)態(tài)獲取計(jì)算資源,還能夠在計(jì)算完成后確保數(shù)據(jù)安全回歸本地。具體而言,無(wú)論是高性能計(jì)算節(jié)點(diǎn)還是小型計(jì)算機(jī),速石科技都能根據(jù)企業(yè)業(yè)務(wù)需求靈活調(diào)度資源,從而在成本與效率之間取得最佳平衡。這種混合云架構(gòu),特別適用于企業(yè)應(yīng)對(duì)周期性高峰任務(wù)或突發(fā)性需求,成為芯片設(shè)計(jì)研發(fā)中的有力補(bǔ)充。
速石科技在自主研發(fā)上的成就也值得關(guān)注。其核心產(chǎn)品Fsched調(diào)度器,經(jīng)過(guò)多年研發(fā),已成為一款完全可控的國(guó)產(chǎn)調(diào)度器,能夠替代國(guó)際主流產(chǎn)品RDM的功能。這不僅實(shí)現(xiàn)了調(diào)度器的自主可控,也填補(bǔ)了國(guó)產(chǎn)替代的技術(shù)空白,為芯片設(shè)計(jì)企業(yè)在研發(fā)中的成本優(yōu)化和技術(shù)安全提供了保障。速石科技通過(guò)這一產(chǎn)品的落地,展現(xiàn)了其在國(guó)產(chǎn)化技術(shù)上的持續(xù)突破和深耕能力。“我們花了四五年時(shí)間研發(fā)Fsched,能夠完全替代國(guó)際主流調(diào)度器,這是一種從無(wú)到有的努力,也是一種堅(jiān)持,”張大成說(shuō)道,“這款產(chǎn)品已經(jīng)在國(guó)內(nèi)被廣泛驗(yàn)證,我們對(duì)國(guó)產(chǎn)化的未來(lái)充滿信心?!?
值得一提的是,近年來(lái),速石科技攜手深信服、芯啟源、沐曦等國(guó)產(chǎn)硬件廠商,以及芯華章、芯和、阿卡思等工業(yè)軟件廠商,深度合作打造了覆蓋底層IT基礎(chǔ)架構(gòu)到上層應(yīng)用軟件的小型信創(chuàng)生態(tài)體系。通過(guò)整合國(guó)產(chǎn)工具鏈資源,速石科技為行業(yè)用戶提供了全方位、一站式的信創(chuàng)解決方案,有力幫助客戶應(yīng)對(duì)當(dāng)前地緣政治帶來(lái)的技術(shù)和供應(yīng)鏈挑戰(zhàn)。
更重要的是,速石科技敏銳地捕捉到了芯片設(shè)計(jì)從單一設(shè)計(jì)向系統(tǒng)級(jí)設(shè)計(jì)轉(zhuǎn)型的趨勢(shì)。隨著EDA工具與CAE仿真工具的逐步融合,芯片設(shè)計(jì)企業(yè)在進(jìn)行SOC和Chiplet設(shè)計(jì)時(shí),需要同時(shí)考慮電磁、結(jié)構(gòu)、功耗完整性等多維度因素。速石科技通過(guò)一體化的技術(shù)平臺(tái),為企業(yè)提供從工具到系統(tǒng)的全面支持,助力客戶應(yīng)對(duì)復(fù)雜系統(tǒng)設(shè)計(jì)的挑戰(zhàn)?!拔磥?lái)的設(shè)計(jì)平臺(tái)一定是面向系統(tǒng)級(jí)設(shè)計(jì)的,這是整個(gè)行業(yè)發(fā)展的方向,”張大成強(qiáng)調(diào),“速石科技希望通過(guò)技術(shù)能力幫助客戶實(shí)現(xiàn)從工具到系統(tǒng)的全面升級(jí)?!?
寫(xiě)在最后
速石科技的云仿真解決方案不僅滿足了當(dāng)前芯片設(shè)計(jì)企業(yè)對(duì)靈活性和成本控制的需求,還通過(guò)混合云架構(gòu)的技術(shù)優(yōu)勢(shì),為行業(yè)探索出了更高效的研發(fā)模式。在國(guó)產(chǎn)化背景下,速石科技的技術(shù)突破也為國(guó)內(nèi)企業(yè)提供了一個(gè)重要的自主可控方向。從仿真到調(diào)度,從工具到系統(tǒng),速石科技正在為芯片設(shè)計(jì)行業(yè)的未來(lái)注入新的動(dòng)力。“云仿真與自主技術(shù)是芯片設(shè)計(jì)企業(yè)邁向未來(lái)的關(guān)鍵?!睆埓蟪煽偨Y(jié)到,“能多做一點(diǎn),就多做一點(diǎn)。我們希望用自己的技術(shù)和方案,幫助企業(yè)走得更遠(yuǎn)?!?