www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 廠商動態(tài) > Achronix半導體
[導讀]近日舉辦的GTC大會把人工智能/機器學習(AI/ML)領(lǐng)域中的算力比拼又帶到了一個新的高度,這不只是說明了通用圖形處理器(GPGPU)時代的來臨,而是包括GPU、FPGA和NPU等一眾數(shù)據(jù)處理加速器時代的來臨,就像GPU以更高的計算密度和能效勝出CPU一樣,各種加速器件在不同的AI/ML應(yīng)用或者細分市場中將各具優(yōu)勢,未來并不是只要貴的而是更需要對的。

近日舉辦的GTC大會把人工智能/機器學習(AI/ML)領(lǐng)域中的算力比拼又帶到了一個新的高度,這不只是說明了通用圖形處理器(GPGPU)時代的來臨,而是包括GPU、FPGA和NPU等一眾數(shù)據(jù)處理加速器時代的來臨,就像GPU以更高的計算密度和能效勝出CPU一樣,各種加速器件在不同的AI/ML應(yīng)用或者細分市場中將各具優(yōu)勢,未來并不是只要貴的而是更需要對的。

此次GTC上新推出的用于AI/ML計算或者大模型的B200芯片有一個顯著的特點,它與傳統(tǒng)的圖形渲染GPU大相徑庭并與上一代用于AI/ML計算的GPU很不一樣。在其他算力器件品種中也是如此,AI/ML計算尤其是推理應(yīng)用需要一種專為高帶寬工作負載優(yōu)化的新型FPGA,下面我們以Achronix的Speedster7t FPGA芯片為例來看看技術(shù)的演進方向,以及在實際推理應(yīng)用中展現(xiàn)出來的在性價比和能效比等方面優(yōu)于先進GPU的特性。

先來快速看看Speedster7t的產(chǎn)品亮點:該器件集成了800K到1500K等效邏輯單元以及326K到692K 6輸入查找表(LUT),高達120T算力的機器學習處理單元(MLP),同時還配備了高性能存儲和I/O接口,以及最高可達190Mb的嵌入式存儲容量。在外部連接接口部署上,Speedster7t包含16個GDDR6通道,可提供高達4 Tbps的高速存儲帶寬;32對SerDes通道,支持1-112Gbps的數(shù)據(jù)速率;4個400G以太網(wǎng)端口(4× 400G或16× 100G)和2個PCIe Gen5端口,支持16通道(×16)和8通道(×8)配置。

Achronix的Speedster7t FPGA芯片被用戶認為非常適合AI/ML推理原因是: 足夠的算力,靈活可配的計算精度;高帶寬大容量低成本的GDDR6(4Tbps帶寬, 32GB容量);革命性的全新二維片上網(wǎng)絡(luò)(2D NoC)路由架構(gòu);靈活通用的芯片間互聯(lián); 支持用戶基于該芯片開發(fā)自定義的推理系統(tǒng),比如單板多片F(xiàn)PGA甚至多板互聯(lián)以組成更高性能(如1TBbps/64GB,2TBbps/128GB, 4TBbps/256GB…等更高帶寬和更大容量的計算存儲)以支持更大或超大模型推理部署。

簡而言之,相比傳統(tǒng)的推理算力平臺,Speedster7t FPGA可以提供更高性價比和能耗比的大模型推理能力; 另外,在傳統(tǒng)的FPGA處理功能中,越來越多的用戶在該系統(tǒng)中加入機器學習的能力, Speedster7t FPGA能很好勝任傳統(tǒng)FPGA功能和高性能機器學習融合在一起。

一類創(chuàng)新性的高性能FPGA系列產(chǎn)品

Achronix Speedster®7t系列FPGA基于革命性的FPGA架構(gòu),該架構(gòu)經(jīng)過了高度優(yōu)化提供了高速、高帶寬內(nèi)外連接,可以滿足日益增長的人工智能/機器學習、網(wǎng)絡(luò)密集型和數(shù)據(jù)加速應(yīng)用的需求。Speedster7t系列FPGA芯片具有一個革命性的全新二維片上網(wǎng)絡(luò),以及一個針對人工智能/機器學習進行優(yōu)化的高密度的機器學習處理單元陣列。通過將FPGA的可編程性與類似ASIC路由架構(gòu)和計算引擎相結(jié)合,Speedster7t系列提高了高性能FPGA的標準。

全新的二維片上網(wǎng)絡(luò)(2D NoC)提供ASIC級別的性能

Speedster7t系列FPGA芯片具有革命性的2D NoC,可在整個FPGA邏輯陣列中傳輸數(shù)據(jù),并將數(shù)據(jù)傳輸?shù)礁咝阅躀/O和內(nèi)存子系統(tǒng),同時可提供高達20 Tbps的總帶寬。憑借2D NoC,在Speedster7t FPGA芯片不需要消耗任何可編程邏輯資源的情況下來進行數(shù)據(jù)傳輸。在該芯片上的2D NoC提供了20 Tbps的二維片上網(wǎng)絡(luò)總帶寬;該2D NoC不僅覆蓋了芯片全域,而且還連接到各類高速接口和總帶寬高達4 Tbps的高速存儲接口。

高速接口

無論是支持輸入和輸出的數(shù)據(jù)流,還是存儲緩沖這些數(shù)據(jù),對于高性能計算、機器學習和硬件加速解決方案而言,都需要在片內(nèi)和片外傳輸數(shù)據(jù)。Speedster7t系列FPGA芯片的架構(gòu)可支持前所未有的帶寬。包括:

400G以太網(wǎng):Speedster7t系列FPGA芯片支持多達4個400GbE端口或16個100GbE端口,通過2D NoC連接到FPGA邏輯。

PCI Express Gen5:Speedster7t系列FPGA芯片配備了多個PCle Gen5接口,支持速率達32GT/s。

存儲接口:GDDR6 + DDR4/5

Speedster7t器件是唯一在片上支持GDDR6存儲器的FPGA,以最低的DRAM成本(每存儲位)提供最快的SDRAM訪問速度。Speedster7t系列FPGA芯片具有高達4 Tbps的GDDR6帶寬,以很低的成本就可提供相當于基于HBM的FPGA存儲器帶寬。Speedster7t系列FPGA芯片包括了DDR4/5存儲器接口,以支持更深入的緩沖需求。PHY和控制器支持由JEDEC規(guī)范定義的所有標準功能。

機器學習處理單元

每個Speedster7t FPGA器件都具有可編程的數(shù)學計算單元,這些單元被集成至全新的機器學習處理單元(MLP)模塊中。每個MLP都是一個高度可配置的計算密集型模塊,具有多達32個乘法器/累加器(MAC),支持4到24位整數(shù)格式和各種浮點模式,包括Tensorflow的bfloat16格式以及高效的塊浮點格式,大大提高了性能。

MLP模塊包括緊密集成的嵌入式存儲器模塊,以確保機器學習算法將以750 MHz的最高性能運行。這種高密度計算和高性能數(shù)據(jù)傳輸?shù)慕Y(jié)合造就了高性能機器學習處理結(jié)構(gòu),該結(jié)構(gòu)可提供市場上基于FPGA的極高TOPS級別運算能力(TOPS即Tera-Operations Per Second,每秒萬億次運算)。

圖中文字說明:Register File - 寄存器文件,F(xiàn)racturable Adder/Accumulator - 可拆分的加法器/累加器,F(xiàn)loat MAC - 浮點乘累加單元(MAC),Memory Cascade in - 存儲器級聯(lián),Operand Cascade in - 操作數(shù)級聯(lián)。

設(shè)計工具支持

Achronix Tool Suite工具套件是一個支持所有Achronix硬件產(chǎn)品的工具鏈。它可與行業(yè)標準的邏輯綜合和仿真工具結(jié)合使用,從而使FPGA設(shè)計人員能夠輕松地將其設(shè)計映射到Speedster7t FPGA器件中。Achronix Tool Suite工具套件包括Synopsys的Synplify Pro的優(yōu)化版本和Achronix Snapshot調(diào)試器。Achronix仿真庫由Siemens EDA的ModelSim、Synopsys的VCS和Aldec的Riviera-PRO提供支持。

展望:在推理等領(lǐng)域幫助開發(fā)者打造綜合性能優(yōu)于先進GPU的應(yīng)用

隨著AI/ML技術(shù)在各個領(lǐng)域開始廣泛走進應(yīng)用,Achronix根據(jù)Speedster7t FPGA器件的高性能和高帶寬特性,選擇了推理這一個應(yīng)用面非常廣的技術(shù)市場方向,與合作伙伴加大了在Speedster7t FPGA器件上的推理算法和IP的研發(fā),以期幫助更多的創(chuàng)新者實現(xiàn)突破。

該芯片提供了足夠的算力,并利用其片上搭載的二維片上網(wǎng)絡(luò)(2D NoC)和機器學習處理單元(MLP),各種高速接口和GDDR6高帶寬存儲接口,提供了用于大規(guī)模推理應(yīng)用需要的計算器件內(nèi)外連接、硬件加速和存儲調(diào)用等新技術(shù),從而可以支持開發(fā)者快速去實現(xiàn)創(chuàng)新。

這個策略取得了顯著的成果,其中一個領(lǐng)域是加速自動語言識別(ASR)解決方案,它由搭載Speedster7t FPGA器件的VectorPath加速卡提供支持,運行Myrtle.ai提供的基于Achronix FPGA的ASR IP,從而提供業(yè)界領(lǐng)先的、實時的、超低延遲的語音轉(zhuǎn)文本功能。運行在服務(wù)器中的單張VectorPath加速卡可替代多達20臺僅基于CPU的服務(wù)器或10張GPU加速卡。

Speedster7t FPGA的技術(shù)創(chuàng)新為人工智能推理帶來了更高性價比和更高能效比以及可以讓用戶開發(fā)自定義的推理硬件平臺和系統(tǒng)。 在ASR實際性能方面,其出色的超低單詞錯誤率和僅有最先進GPU解決方案八分之一以下的端到端延遲(包括了預處理和后處理以及與CPU做數(shù)據(jù)交互的時間)顛覆了ASR領(lǐng)域。該解決方案可以在標準的機器學習框架中使用垂直應(yīng)用特定的或自定義的數(shù)據(jù)集進行定制或重新訓練。

對于越來越多的其他的推理應(yīng)用,Speedster7t FPGA的獨創(chuàng)高帶寬架構(gòu)也可以為這些應(yīng)用提供有力的支撐。Achronix正在通過不斷研發(fā),以完善其工具鏈和應(yīng)用生態(tài),將在2024年推出更好的工具來幫助各種推理應(yīng)用的開發(fā),使眾多的用戶更加便捷地使用Speedster7t FPGA器件或者VectorPath加速卡來實現(xiàn)性價比和能效提升,而不用去爭搶緊俏的高性能GPU加速卡。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

近日,美國參議院公布了一項引人注目的國防政策方案,其中包含的“2025年國家人工智能保障準入和創(chuàng)新法案”(簡稱GAIN AI法案)再次在全球科技領(lǐng)域掀起波瀾。

關(guān)鍵字: AI GPU

重慶2025年9月6日 /美通社/ -- iChongqing新聞報道:2025世界智能產(chǎn)業(yè)博覽會于9月5日在重慶開幕,550余家企業(yè)參展,展示了從自動駕駛和人工智能(AI)座艙到擴展現(xiàn)實(XR)影視和機器人咖啡廳的30...

關(guān)鍵字: 人工智能 新能源汽車 AI 機器人

慕尼黑2025年9月6日 /美通社/ -- 近日,廣汽正式推出全新增程技術(shù)——"星源增程"(英文名為ADiMOTION),全面提升增程器效率、動力響應(yīng)及NVH表現(xiàn),同時配合AI能量控制平臺,實現(xiàn)每一度...

關(guān)鍵字: 廣汽 AI 增程器 電機

北京2025年9月5日 /美通社/ -- 近日,2025年中瑞商業(yè)大獎頒獎典禮在北京舉行,SGS通標標準技術(shù)服務(wù)有限公司(以下稱SGS通標)作為瑞士SGS在中國的分支機構(gòu)榮獲了傳承獎的殊榮。SGS通標北京總經(jīng)理...

關(guān)鍵字: 可持續(xù)發(fā)展 ST AI ABILITY

北京2025年9月5日 /美通社/ -- 9月2日,濟南城市投資集團有限公司(簡稱"濟南城投")與軟通動力信息技術(shù)(集團)股份有限公司(簡稱"軟通動力")正式簽署戰(zhàn)略合作...

關(guān)鍵字: AI 數(shù)字經(jīng)濟 智能化 人工智能技術(shù)

中國鄭州2025年9月5日 /美通社/ --?全球領(lǐng)先的電動客車制造商宇通客車("宇通",上交所代碼:600066)全新升級的車聯(lián)網(wǎng)系統(tǒng)Link+采用先進技術(shù)實現(xiàn)車隊車輛與管理平臺的智能互聯(lián)。作為Vehicle+升級版,...

關(guān)鍵字: LINK 車聯(lián)網(wǎng) AI PS

大眾汽車集團加速推進生產(chǎn)數(shù)字化轉(zhuǎn)型 數(shù)字化生產(chǎn)平臺(Digital Production Platform)成為大眾汽車的"工廠云",在全球生產(chǎn)基地實現(xiàn)人工智能(AI)與前沿 IT...

關(guān)鍵字: 亞馬遜 大眾汽車 AI 數(shù)字化

北京2025年9月5日 /美通社/ -- 9月4日,在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會上,北京經(jīng)開區(qū)對外發(fā)布,北京經(jīng)濟技術(shù)開發(fā)區(qū)(簡稱"北京經(jīng)開區(qū)&q...

關(guān)鍵字: 人工智能 模型 開源 AI

RighValor現(xiàn)已基于Synaptics? Astra? SL1600系列SOC運行,提供隱私至上的實時邊緣智能。 加利福尼亞州帕洛阿爾托2025年9月5日 /美通社/ --?邊緣分布式代理AI先驅(qū)企業(yè)Righ今日...

關(guān)鍵字: 智能家居 SYNAPTICS AI ST

柏林2025年9月4日 /美通社/ -- 全球消費電子與家電領(lǐng)先品牌海信,將以AI Your Life為主題在IFA 2025呈現(xiàn)全線人工智能創(chuàng)新成果。從沉浸式娛樂、影院級畫質(zhì)到智能家居生活與氣候智能健康,海信將展示AI...

關(guān)鍵字: 海信 AI RGB MINILED
關(guān)閉