當(dāng)前位置：首頁 > 原創(chuàng) > 劉巖軒

原創(chuàng)

告別多芯片方案！用一顆自適應(yīng)SoC實現(xiàn)端側(cè)的AI全流程計算加速

時間：2024-04-10 16:01:29

關(guān)鍵字： AMD FPGA 自適應(yīng)SoC AI 邊緣計算

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]為無處不在的端側(cè)設(shè)備插上AI的翅膀，AMD發(fā)布第二代Versal? 自適應(yīng) SoC

2018年ACAP（適應(yīng)性計算加速平臺）是Xlinx（現(xiàn)已并入AMD）的一個重要里程碑。彼時剛上任CEO的Victor Peng宣布了Versal ACAP這一全新的平臺，這一更靈活的產(chǎn)品形態(tài)打開了傳統(tǒng)FPGA產(chǎn)品邁向全面自適應(yīng)加速計算的新市場。

在2018年，ACAP需要解決的問題是為端邊云實現(xiàn)大幅計算加速，增加在各種工作負(fù)載中的計算密度。Versal" 可能是 "Versatile"（多功能的）和 "Universal"（通用的）的結(jié)合，通過對于多種加速器IP的融合，旨在“在整個行業(yè)工藝制程線性增長受限的情況下，維持計算密度的加速增長曲線”。而到了2024年的今天，無人不談AI，AI無處不在。當(dāng)AI從云走向端側(cè)，新的計算難題來了。如何為端側(cè)設(shè)備實現(xiàn)更高效的AI計算，為其插上AI的翅膀？這將會是AMD最新發(fā)布的第二代Versal? AI Edge系列自適應(yīng) SoC想要解決的難題。

在端側(cè)設(shè)備上的實現(xiàn)AI加速計算，面臨哪些難題？

在端側(cè)設(shè)備，也就是嵌入式系統(tǒng)中要實現(xiàn)AI計算，面臨著諸多的限制。這些限制一部分是來自傳統(tǒng)的我們所能熟知的應(yīng)用環(huán)境和設(shè)備自身，包括功耗水平、體積、散熱、實時性、信息安全和功能安全等等，針對這些問題的優(yōu)化，是所有類型的端側(cè)計算芯片廠商都在著力的方向。而談及在端側(cè)上部署AI計算，AMD則從系統(tǒng)角度觀察到了另一個更為關(guān)鍵的問題。

據(jù)AMD自適應(yīng)與嵌入式計算事業(yè)部(AECG ) Versal產(chǎn)品營銷總監(jiān)Manuel Uhm介紹，在AI驅(qū)動型嵌入式系統(tǒng)中，包含三個處理階段，分別是預(yù)處理（傳感器處理于融合，數(shù)據(jù)調(diào)節(jié)）、AI推理（感知、分析、情景感知）和后處理（決策、控制、反饋）。

目前大家的關(guān)注重點都放在AI推理階段，因為這是AI算法運行的階段。但其實在嵌入式系統(tǒng)中要應(yīng)該從更加宏觀的系統(tǒng)視角來審視——首先要有數(shù)據(jù)，數(shù)據(jù)要經(jīng)過預(yù)處理，才能提供給推斷來使用；推斷之后又必須要進(jìn)行后處理，這樣才可以通過推斷的結(jié)果做出決策。“在實時AI驅(qū)動嵌入式系統(tǒng)當(dāng)中，這三類算力都必須能夠加速，才能夠真正實現(xiàn)全系統(tǒng)的實時。”Manuel Uhm解釋到。

預(yù)處理階段需要將各類傳感器采集的原始數(shù)據(jù)進(jìn)行處理，這其中也涉及到了一些傳感器的數(shù)據(jù)融合和數(shù)據(jù)調(diào)節(jié)的工作，該階段是提高AI驅(qū)動型嵌入式系統(tǒng)的實時性和高效計算的關(guān)鍵?？删幊踢壿嬙谶@一階段的優(yōu)勢在于，能夠非常靈活地適用各類傳感器類型接口，同時保證更低的時延和更好的確定性，并且能夠在現(xiàn)場完成部署之后持續(xù)升級。接下來在推理過程中，包含著大量的矢量數(shù)據(jù)計算工作，需要的是專用的矢量處理器來實現(xiàn)加速分析。而在最后一步的后處理階段則需要高性能的嵌入式CPU來做出決策和實現(xiàn)控制。

梳理完整個AI驅(qū)動型嵌入式系統(tǒng)的內(nèi)部數(shù)據(jù)處理流程之后，就不難發(fā)現(xiàn)當(dāng)前的行業(yè)痛點所在——目前沒有一類處理器能夠同時針對預(yù)處理、AI推理和后處理三個階段同時優(yōu)化。即便是集成了AI Core的第一代Verssal自適應(yīng)SoC，也只可以完成“預(yù)處理+AI推理”兩個階段，但無法覆蓋到最終的決策和控制過程中。

多芯片方案將會帶來更高的BOM成本、更大的體積占用、更高的功耗、更復(fù)雜的供電設(shè)計。多芯片之間的互聯(lián)互通問題，也帶來了更高的系統(tǒng)時延和信息安全挑戰(zhàn)，也使得系統(tǒng)集成、軟件設(shè)計方面的復(fù)雜度進(jìn)一步提升。

而AMD此次最新推出的第二代Versal自適應(yīng)SoC中的AI Edge系列就可以很好地解決這一系列的難題，為AI驅(qū)動型嵌入式系統(tǒng)提供單片智能的解決方案。

在單芯片中實現(xiàn)AI應(yīng)用的端到端加速，第二代Versal AI Edge從邊緣傳感器走向中央計算

據(jù)悉，此次最新發(fā)布的第二代Versal自適應(yīng)SoC包含兩個系列，其中AI Edge系列是專門面向AI驅(qū)動型嵌入式系統(tǒng)打造，Prime系列則是主打經(jīng)典嵌入式系統(tǒng)的市場。相比上一代Versal產(chǎn)品，新一代實現(xiàn)了高達(dá)3倍的每瓦TOPS性能提升，全新的高性能集成CPU也帶來了高達(dá)10倍的標(biāo)量計算能力提升。

“單芯片智能意味著在單個器件中提供端到端的加速，也就是可以實現(xiàn)AI全部三個階段的加速?！盡anuel分享到。在Versal第二代產(chǎn)品中，第一階段的傳感器數(shù)據(jù)預(yù)處理加速，可以由其中的可編輯邏輯塊來完成，而特別針對視頻和圖像信號預(yù)處理，還可以直接調(diào)用其中針對視頻和圖像處理的硬加速IP來完成。在第二階段的AI推理方面，可以通過新產(chǎn)品中內(nèi)置的AIE-ML v2這一AI引擎來完成。而在第三階段的控制和執(zhí)行階段的實時性保證方面，則有集成的Arm Cortex-A78AE和Cortex-R52來支持。

據(jù)了解，Versal不僅僅是單芯片實現(xiàn)AI智能，帶來了單芯片的方案優(yōu)勢。而且每一階段分開來對比多芯片的方案，也有著明顯的計算加速的提升。

在預(yù)處理階段，傳統(tǒng)的非自適應(yīng)SoC的接口數(shù)量和類型往往是有限且固定的，當(dāng)需要照顧到一些不同類型的傳感器連接、進(jìn)行多類型數(shù)據(jù)傳輸和處理時，就必然要通過外部的內(nèi)存來進(jìn)行緩存，這就必然會導(dǎo)致整個處理效率低下，時延變長。而采用可編程邏輯就靈活的多，能夠應(yīng)對各種復(fù)雜的多傳感器配置，且不需要外部內(nèi)存，也沒有緩存的配置需求，整個執(zhí)行時間大大縮短，時延得到有效降低。

在AI推理方面，面臨著多類型數(shù)據(jù)高速吞吐和精準(zhǔn)度的挑戰(zhàn)。而二代Versal AI Edge系列能夠?qū)崿F(xiàn)對于MX6數(shù)據(jù)類型高達(dá)370 TFLOPS的算力支持，對于INT8高達(dá)184TOPS的算力支持；內(nèi)部集成的AIE-ML v2引擎還可以進(jìn)行像FIR、FFT等數(shù)據(jù)信號的處理工作。

在最后的控制和執(zhí)行階段，二代Versal中的Arm Cortex-A78AE核心，每核心最高頻率高達(dá)2.2GHz，并且有高達(dá)200.3K的DMIPS算力。針對控制功能的實時處理單元，RPU可以有高達(dá)10倍的Arm Cortex-R52核心，每核心最高頻率高達(dá)1.05 GHz，提供高達(dá)28.5K的DMIPS算力。

同時Manuel也強調(diào)，二代Versal AI Edge系列最高級別產(chǎn)品將會通過ASIL-D車規(guī)級認(rèn)證和SIL3安全認(rèn)證，以滿足汽車、工業(yè)和機器人等應(yīng)用客戶的功能安全需求。

據(jù)悉，斯巴魯將會在EyeSight系統(tǒng)中使用AMD的第二代Versal器件，通過單芯片智能的極低時延、多數(shù)據(jù)類型支持和高吞吐量等優(yōu)勢，來支持其車型實現(xiàn)碰撞前制動、車道偏離預(yù)警、自適應(yīng)巡航控制和車道保持輔助。

第二代Versal的單芯片方案，相對于傳統(tǒng)的多芯片方案而言，在AI驅(qū)動型嵌入式系統(tǒng)上帶來的優(yōu)化是顯著的。舉例而言，在一個高級自動駕駛輔助系統(tǒng)中，同等的功率水平下就能夠具有4倍圖像處理的能力；而在智慧城市攝像頭的系統(tǒng)中，可以實現(xiàn)30%的占板面積減少和支持2倍的視頻流提升；在專業(yè)的音視頻和廣播視頻流處理系統(tǒng)中，能夠?qū)崿F(xiàn)每秒60幀的高精度流量表現(xiàn)，與Zynq MPSoC的效率相比，提供2倍的視頻處理面積，每路視頻流占板面積縮小35%。

Manuel表示，“第二代Versal AI Edge系列的產(chǎn)品，最主要的目的是能夠形成系統(tǒng)的中央計算，這與第一代是不同的。第一代更多是進(jìn)行CPU的加速，但是現(xiàn)在新一代主要針對的就是中央計算引擎。我們在這個領(lǐng)域也是深耕很多年，憑借著幾十年的經(jīng)驗，也是在市場上能夠應(yīng)對嵌入式系統(tǒng)所帶來的各種挑戰(zhàn)而推出解決方案?！?

---

據(jù)悉，的第二代Versal自適應(yīng)SoC目前正在與主要客戶進(jìn)行接洽，早期訪問文檔現(xiàn)已發(fā)布。而芯片樣片預(yù)計將于2025上半年正式發(fā)布，有望在2025年末實現(xiàn)大規(guī)模量產(chǎn)出貨。

聲明：該篇文章為本站原創(chuàng)，未經(jīng)授權(quán)不予轉(zhuǎn)載，侵權(quán)必究。

換一批

美國又出“昏招”：擬全面限制高端GPU出口

近日，美國參議院公布了一項引人注目的國防政策方案，其中包含的“2025年國家人工智能保障準(zhǔn)入和創(chuàng)新法案”（簡稱GAIN AI法案）再次在全球科技領(lǐng)域掀起波瀾。

關(guān)鍵字： AI GPU

[美通社全球TMT]

世界智能產(chǎn)業(yè)博覽會于重慶開幕，人工智能與新能源汽車成焦點

重慶2025年9月6日 /美通社/ -- iChongqing新聞報道：2025世界智能產(chǎn)業(yè)博覽會于9月5日在重慶開幕，550余家企業(yè)參展，展示了從自動駕駛和人工智能(AI)座艙到擴展現(xiàn)實(XR)影視和機器人咖啡廳的30...

關(guān)鍵字：人工智能新能源汽車 AI 機器人

[美通社全球TMT]

六大"行業(yè)領(lǐng)先"！廣汽星源增程正式發(fā)布，定義中國最強增程技術(shù)

慕尼黑2025年9月6日 /美通社/ -- 近日，廣汽正式推出全新增程技術(shù)——"星源增程"（英文名為ADiMOTION），全面提升增程器效率、動力響應(yīng)及NVH表現(xiàn)，同時配合AI能量控制平臺，實現(xiàn)每一度...

關(guān)鍵字：廣汽 AI 增程器電機

[美通社全球TMT]

中瑞建交75周年之際 SGS通標(biāo)榮獲中瑞商業(yè)大獎傳承獎

北京2025年9月5日 /美通社/ -- 近日，2025年中瑞商業(yè)大獎頒獎典禮在北京舉行，SGS通標(biāo)標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司（以下稱SGS通標(biāo)）作為瑞士SGS在中國的分支機構(gòu)榮獲了傳承獎的殊榮。SGS通標(biāo)北京總經(jīng)理...

關(guān)鍵字：可持續(xù)發(fā)展 ST AI ABILITY

[美通社全球TMT]

軟通動力"智"繪濟(jì)南新篇：FunAI3落地，軟通華方領(lǐng)銜，共筑北方硬核算力"底座"

北京2025年9月5日 /美通社/ -- 9月2日，濟(jì)南城市投資集團(tuán)有限公司（簡稱"濟(jì)南城投"）與軟通動力信息技術(shù)（集團(tuán)）股份有限公司（簡稱"軟通動力"）正式簽署戰(zhàn)略合作...

關(guān)鍵字： AI 數(shù)字經(jīng)濟(jì) 智能化人工智能技術(shù)

[美通社全球TMT]

宇通車聯(lián)網(wǎng)系統(tǒng)Link+，賦能車隊實現(xiàn)智慧管理與高效運營升級

中國鄭州2025年9月5日 /美通社/ --?全球領(lǐng)先的電動客車制造商宇通客車（"宇通"，上交所代碼：600066）全新升級的車聯(lián)網(wǎng)系統(tǒng)Link+采用先進(jìn)技術(shù)實現(xiàn)車隊車輛與管理平臺的智能互聯(lián)。作為Vehicle+升級版，...

關(guān)鍵字： LINK 車聯(lián)網(wǎng) AI PS

[美通社全球TMT]

更高效、更智能、更韌性：大眾汽車集團(tuán)攜手亞馬遜云科技，助力生產(chǎn)轉(zhuǎn)型邁入AI時代

大眾汽車集團(tuán)加速推進(jìn)生產(chǎn)數(shù)字化轉(zhuǎn)型數(shù)字化生產(chǎn)平臺（Digital Production Platform）成為大眾汽車的"工廠云"，在全球生產(chǎn)基地實現(xiàn)人工智能（AI）與前沿 IT...

關(guān)鍵字：亞馬遜大眾汽車 AI 數(shù)字化

[美通社全球TMT]

北京經(jīng)開區(qū)構(gòu)建五大支撐體系，加快建設(shè)全域人工智能之城

北京2025年9月5日 /美通社/ -- 9月4日，在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會上，北京經(jīng)開區(qū)對外發(fā)布，北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)（簡稱"北京經(jīng)開區(qū)&q...

關(guān)鍵字：人工智能模型開源 AI

[美通社全球TMT]