www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 廠商動(dòng)態(tài) > Achronix半導(dǎo)體
[導(dǎo)讀]交互式人工智能(CAI)使用機(jī)器學(xué)習(xí)(ML)的子集深度學(xué)習(xí)(DL),通過機(jī)器實(shí)現(xiàn)語音識(shí)別、自然語言處理和文本到語音的自動(dòng)化。

使用交互式人工智能(CAI)實(shí)現(xiàn)語音轉(zhuǎn)錄成本降低高達(dá)90%

交互式人工智能(CAI)簡(jiǎn)介

什么是交互式人工智能(AI)?

交互式人工智能(CAI)使用機(jī)器學(xué)習(xí)(ML)的子集深度學(xué)習(xí)(DL),通過機(jī)器實(shí)現(xiàn)語音識(shí)別、自然語言處理和文本到語音的自動(dòng)化。CAI流程通常用三個(gè)關(guān)鍵的功能模塊來描述:

1.語音轉(zhuǎn)文本(STT),也稱為自動(dòng)語音識(shí)別(ASR)

2自然語言處理(NLP)

3文本轉(zhuǎn)語音(TTS)或語音合成

圖1:交互式AI構(gòu)建模塊

本篇白皮書詳細(xì)介紹了自動(dòng)語音識(shí)別(ASR)的應(yīng)用場(chǎng)景,以及Achronix如何在實(shí)現(xiàn)ASR解決方案的同時(shí)將相關(guān)成本降低高達(dá)90%。

細(xì)分市場(chǎng)和應(yīng)用場(chǎng)景

僅在美國(guó)就有超過1.1億個(gè)虛擬助手在發(fā)揮作用[1],大多數(shù)人對(duì)使用CAI服務(wù)都很熟悉。主要示例包括移動(dòng)設(shè)備上的語音助手,例如蘋果的Siri或亞馬遜的Alexa;筆記本電腦上的語音搜索助手,例如微軟的Cortana;自動(dòng)呼叫中心應(yīng)答助理;以及支持語音功能的設(shè)備,例如智能音箱、電視和汽車等。

支持這些CAI服務(wù)的深度學(xué)習(xí)算法可以在本地電子設(shè)備上進(jìn)行處理,或者聚集在云中進(jìn)行遠(yuǎn)程大規(guī)模處理。支持?jǐn)?shù)百萬用戶交互的大規(guī)模部署是一個(gè)巨大的計(jì)算處理挑戰(zhàn),超大規(guī)模的提供商已經(jīng)通過開發(fā)專用的芯片和設(shè)備來處理這些服務(wù)。

現(xiàn)在,大多數(shù)小型企業(yè)都可以使用亞馬遜、IBM、微軟和谷歌等公司提供的云API,輕松地將語音接口添加到他們的產(chǎn)品中。然而,當(dāng)這些工作負(fù)載的規(guī)模增加時(shí)(本白皮書后面將介紹一個(gè)具體的示例),使用這些云API的成本將會(huì)變得過高,迫使企業(yè)尋求其他解決方案。此外,許多企業(yè)運(yùn)營(yíng)對(duì)數(shù)據(jù)安全性有更高的要求,因此需要將解決方案必須保留在企業(yè)的數(shù)據(jù)安全范圍內(nèi)。

企業(yè)級(jí)CAI解決方案可用于以下應(yīng)用場(chǎng)景:

自動(dòng)呼叫中心

語音和視頻通信平臺(tái)

健康和醫(yī)療服務(wù)

金融和銀行服務(wù)

零售和售貨販賣設(shè)備

詳細(xì)介紹ASR處理過程

ASR是CAI流程的第一步,在這里語音被轉(zhuǎn)錄為文本。一旦文本可用,就可以使用自然語言處理(NLP)算法以多種方式對(duì)其進(jìn)行處理。NLP包括關(guān)鍵內(nèi)容識(shí)別、情感分析、索引、語境化內(nèi)容和分析。在端到端的交互式AI算法中,語音合成用于生成自然的語音響應(yīng)。

最先進(jìn)的ASR算法是通過端到端的深度學(xué)習(xí)來實(shí)現(xiàn)。不同于卷積神經(jīng)網(wǎng)絡(luò)(CNN),遞歸神經(jīng)網(wǎng)絡(luò)(RNN)在語音識(shí)別中很常見。正如來自TechTarget [10]的David Petersson在《CNN與RNN:它們有何不同?》文章中提到:RNN更適合處理時(shí)間數(shù)據(jù),與ASR應(yīng)用非常適配?;赗NN的模型需要較高的計(jì)算能力和存儲(chǔ)帶寬來處理神經(jīng)網(wǎng)絡(luò)模型,并滿足交互式系統(tǒng)所需的嚴(yán)格的延遲目標(biāo)。當(dāng)實(shí)時(shí)或自動(dòng)響應(yīng)太慢時(shí),它們會(huì)顯得遲緩和不自然。通常只有犧牲處理效率才能實(shí)現(xiàn)低延遲,這會(huì)增加成本,并且對(duì)于實(shí)際部署來說會(huì)變得過于龐大。

Achronix與采用現(xiàn)場(chǎng)可編程邏輯門陣列(FPGA)進(jìn)行AI推理的專業(yè)技術(shù)公司Myrtle.ai展開合作。Myrtle.ai利用其MAU推理加速引擎在FPGA上實(shí)現(xiàn)基于RNN的高性能網(wǎng)絡(luò)。該設(shè)計(jì)已集成到Achronix Speedster®7t AC7t1500 FPGA器件中,可以利用Speedster7t架構(gòu)的關(guān)鍵架構(gòu)優(yōu)勢(shì)(將在本白皮書后面進(jìn)行探討),大幅提高實(shí)時(shí)ASR神經(jīng)網(wǎng)絡(luò)的加速處理,從而與服務(wù)器級(jí)中央處理器(CPU)相比,可處理的實(shí)時(shí)數(shù)據(jù)流(RTS)的數(shù)量增加2500%。

數(shù)據(jù)加速器:如何實(shí)現(xiàn)資源的合理平衡分配

數(shù)據(jù)加速器可以卸載通常由主CPU執(zhí)行的計(jì)算、網(wǎng)絡(luò)和/或存儲(chǔ)處理工作負(fù)載,從而可以顯著減少服務(wù)器的占用空間。本白皮書介紹了用一臺(tái)服務(wù)器和一個(gè)Achronix基于ASR的加速卡可取代多達(dá)25臺(tái)服務(wù)器。這種架構(gòu)大大降低了工作負(fù)載成本、功耗和延遲,同時(shí)提高了工作負(fù)載吞吐量。然而,只有在硬件得到有效使用并且部署具有成本效益的情況下,使用數(shù)據(jù)加速硬件來實(shí)現(xiàn)高性能和低延遲才有意義。

ASR模型對(duì)現(xiàn)代數(shù)據(jù)加速器來說是一種挑戰(zhàn),通常需要手動(dòng)調(diào)整以實(shí)現(xiàn)比平臺(tái)主要性能規(guī)格的個(gè)位數(shù)效率更高的性能。實(shí)時(shí)ASR工作負(fù)載需要高存儲(chǔ)帶寬以及高性能計(jì)算。這些大型神經(jīng)網(wǎng)絡(luò)所需的數(shù)據(jù)通常存儲(chǔ)在加速卡上的DDR存儲(chǔ)器中。將數(shù)據(jù)從外部存儲(chǔ)器傳輸?shù)接?jì)算平臺(tái)是該工作負(fù)載中的性能瓶頸,特別是在進(jìn)行實(shí)時(shí)部署的時(shí)候。

圖形處理器(GPU)架構(gòu)是基于數(shù)據(jù)并行模型,較小的批處理量(batch size)會(huì)導(dǎo)致GPU加速硬件的利用率較低,從而導(dǎo)致成本增加和效率降低。硬件加速解決方案數(shù)據(jù)表(以TOPS即每秒萬億次操作為單位進(jìn)行衡量)中的性能數(shù)據(jù)并不能總是很好地表示實(shí)際性能,因?yàn)樵S多硬件加速器件由于與器件架構(gòu)相關(guān)的瓶頸而未得到充分利用。這些數(shù)據(jù)以TOPS為單位,強(qiáng)調(diào)了加速器計(jì)算引擎的處理能力,但忽略了關(guān)鍵因素,例如外部存儲(chǔ)器的批處理量、速度和規(guī)模,以及在外部存儲(chǔ)器和加速器計(jì)算引擎之間傳輸數(shù)據(jù)的能力。對(duì)于ASR工作負(fù)載,關(guān)注存儲(chǔ)帶寬和在加速器內(nèi)高效地傳輸數(shù)據(jù)為加速器性能和效率的實(shí)現(xiàn)提供了更強(qiáng)有力的指導(dǎo)。

加速器必須具有更大的外部存儲(chǔ)規(guī)模和非常高的帶寬。當(dāng)今的高端加速器通常使用高性能的外部存儲(chǔ)器,存儲(chǔ)規(guī)模達(dá)8-16 GB,運(yùn)行速度可高達(dá)4 Tbps。它還必須能夠?qū)⑦@些數(shù)據(jù)傳輸?shù)接?jì)算平臺(tái)而不會(huì)影響性能。然而,無論如何去實(shí)現(xiàn)高速存儲(chǔ)和計(jì)算引擎之間的數(shù)據(jù)通道,它幾乎在所有情況下都是系統(tǒng)性能的瓶頸,特別是在實(shí)時(shí)ASR這樣的低延遲應(yīng)用中。

FPGA設(shè)計(jì)旨在存儲(chǔ)和計(jì)算之間提供最佳的數(shù)據(jù)路由通道,從而為這些工作負(fù)載提供一個(gè)出色的加速平臺(tái)。

Achronix解決方案與其他FPGA解決方案的對(duì)比

在機(jī)器學(xué)習(xí)(ML)加速領(lǐng)域中,已有FPGA架構(gòu)宣稱其推理速度可高達(dá)150 TOPS。然而在實(shí)際應(yīng)用中,尤其是在那些對(duì)延遲敏感的應(yīng)用(如ASR)中,由于無法在計(jì)算平臺(tái)和外部存儲(chǔ)器之間高效地傳輸數(shù)據(jù),所以這些FPGA遠(yuǎn)不能達(dá)到其聲稱的最高推理速度。由于數(shù)據(jù)從外部存儲(chǔ)器傳輸?shù)紽PGA器件中的計(jì)算引擎時(shí)出現(xiàn)了瓶頸,從而造成了這種性能上的損失。Achronix Speedster7t架構(gòu)在計(jì)算引擎、高速存儲(chǔ)接口和數(shù)據(jù)傳輸之間取得了良好的平衡,使Speedster7tFPGA器件能夠?yàn)閷?shí)時(shí)、低延遲的ASR工作負(fù)載提供高性能,可實(shí)現(xiàn)最高TOPS速率的64%等級(jí)。

圖2:Speedster7t器件的計(jì)算、存儲(chǔ)和數(shù)據(jù)傳輸能力

Speedster7t架構(gòu)如何實(shí)現(xiàn)更高的計(jì)算效率

在Speedster7t上搭載的機(jī)器學(xué)習(xí)處理器(MLP)是一種優(yōu)化的矩陣/向量乘法模塊,能夠在單個(gè)時(shí)鐘周期內(nèi)進(jìn)行32次乘法和1次累加,是計(jì)算引擎架構(gòu)的基礎(chǔ)。AC7t1500器件中的Block RAM(BRAM)與2560個(gè)MLP實(shí)例都處于同一位置,這意味著更低的延遲和更高的吞吐量。

借助于這些關(guān)鍵的架構(gòu)單元,Myrtle.ai的MAU低延遲、高吞吐量的ML推理引擎已集成到Speedster7t FPGA器件中。

在構(gòu)建最佳的ASR解決方案時(shí),集成了之前提到的來自Myrtle.ai的MAU推理引擎,使用了2560個(gè)MLP中的2000個(gè)。由于MLP是一個(gè)硬模塊,它可以運(yùn)行在比FPGA邏輯陣列本身更高的時(shí)鐘速率上。

圖3:機(jī)器學(xué)習(xí)處理器

在AC7t1500器件中使用了8個(gè)GDDR6存儲(chǔ)控制器,它們總共可提供高達(dá)4 Tbps的雙向帶寬。如上所述,強(qiáng)大的計(jì)算引擎和大容量、高帶寬的存儲(chǔ)依賴于高速、低延遲和確定性的數(shù)據(jù)傳輸,以提供低延遲ASR應(yīng)用所需的實(shí)時(shí)結(jié)果。

隨后這些數(shù)據(jù)進(jìn)入到Speedster7t的二維片上網(wǎng)絡(luò)(2D NoC)。該二維片上網(wǎng)絡(luò)是Speedster7t架構(gòu)中的另一種硬結(jié)構(gòu),時(shí)鐘頻率高達(dá)2 GHz,可與所有I/O、內(nèi)部硬模塊和FPGA邏輯陣列本身互連。憑借20 Tbps的總帶寬,2D NoC提供了最高的吞吐量,并通過適當(dāng)?shù)膶?shí)現(xiàn)方式,可以在外部GDDR6存儲(chǔ)器和支持MLP的計(jì)算引擎之間提供最具確定性的、低延遲的數(shù)據(jù)傳輸。

圖4:總帶寬為20 Tbps的2D NoC

與其他競(jìng)爭(zhēng)性廠商的解決方案不同,2D NoC消除了Speedster7t ASR解決方案在存儲(chǔ)器和計(jì)算引擎之間的任何瓶頸,在這些非常低的批處理速率下,硬件加速器的利用率達(dá)到最佳狀態(tài)。

將所有這些功能放在一個(gè)roofline圖中,就可以清楚地說明Achronix Speedster7t器件在低延遲ASR應(yīng)用中相對(duì)于其他競(jìng)爭(zhēng)性FPGA解決方案的優(yōu)勢(shì)。該roofline圖使用了由每個(gè)制造商公布的經(jīng)過驗(yàn)證的TOPS數(shù)據(jù),展示了這些器件在實(shí)際應(yīng)用中可以達(dá)到的效果。

下圖顯示了一個(gè)有效TOPS的roofline模型,它使用了Achronix為微基準(zhǔn)(GEMV和MLP)和測(cè)試而構(gòu)建的子集,以及公司A [4] [5]和公司B(基于架構(gòu))發(fā)布的數(shù)據(jù)。橙色的豎線表示批處理量為8毫秒和80毫秒音頻模塊的最佳操作點(diǎn),用于低延遲、實(shí)時(shí)ASR數(shù)據(jù)流應(yīng)用。在這個(gè)最佳操作點(diǎn)上,Achronix的有效TOPS比公司A提高了44%,比公司B的解決方案提高了260%。

圖5:有效TOPS的Roofline模型

在一年內(nèi)實(shí)現(xiàn)ASR處理成本降低高達(dá)90%的目標(biāo)

大多數(shù)ASR解決方案由Google、Amazon、Microsoft Azure和Oracle等大型云服務(wù)提供商提供。隨著運(yùn)營(yíng)規(guī)模的擴(kuò)大,以及這些產(chǎn)品在市場(chǎng)上取得的成功,在這些云API基礎(chǔ)上構(gòu)建產(chǎn)品的服務(wù)提供商面臨著越來越高的成本壓力。較大規(guī)模的ASR提供商公開宣傳成本從每分鐘0.01美元到0.025美元不等[6]、[7]、[8]、[9]。行業(yè)報(bào)告顯示,呼叫中心的平均呼叫時(shí)間約為5分鐘。考慮一個(gè)大型企業(yè)數(shù)據(jù)或呼叫中心服務(wù)公司每天要處理50,000通電話,每通電話5分鐘。按照上述費(fèi)率計(jì)算,ASR處理成本將是每天1,500至6,000美元或每年50萬至200萬美元。Achronix和Myrtle.ai的解決方案可以集成在一個(gè)加速卡上支持處理4000個(gè)RTS,每天可以處理超過一百萬次的呼叫。

有許多因素會(huì)決定獨(dú)立ASR設(shè)備的成本。在這個(gè)特定示例中,假設(shè)Achronix ASR加速解決方案是通過基于FPGA的PCIe卡提供,并集成到基于x86架構(gòu)的2U服務(wù)器中。該設(shè)備從系統(tǒng)集成商那里出售,價(jià)格可能為50,000美元,而每年運(yùn)行服務(wù)器的成本可能是這個(gè)成本的兩倍。這樣一來,本地ASR設(shè)備第一年的費(fèi)用就達(dá)到了10萬美元。將這種本地解決方案與云API服務(wù)進(jìn)行比較,終端用戶可以在第一年節(jié)省5到20倍的費(fèi)用。

表1:Achronix ASR解決方案與云API服務(wù)的對(duì)比總結(jié)

項(xiàng)目
Speedster7t解決方案
云API
(最低成本)
云API
(最高成本)
每天成本(50k RTS)
$275
$1.5k
$6k
年度成本
$100k
$500k
$2,000k
降低成本vs云API
5X to 20X


高度緊湊的系統(tǒng)使企業(yè)能夠隨著其業(yè)務(wù)的增加而擴(kuò)展,而無需依賴日益昂貴的ASR云API,也無需構(gòu)建龐大的數(shù)據(jù)中心基礎(chǔ)設(shè)施來提供本地解決方案。

總結(jié)

CAI中的ASR功能要求RNN機(jī)器學(xué)習(xí)算法具有低延遲、高吞吐量的計(jì)算,這對(duì)現(xiàn)代AI加速器提出了挑戰(zhàn)。聲稱推理速度高達(dá)150TOPS的FPGA硬件加速器在大型計(jì)算引擎和高速存儲(chǔ)器之間傳輸數(shù)據(jù)時(shí)會(huì)遇到瓶頸,這些瓶頸可能導(dǎo)致硬件利用率低至5%。Achronix和Myrtle.ai攜手推出一個(gè)ASR平臺(tái),該平臺(tái)由一個(gè)200W、x16PCIe Gen4加速卡和相關(guān)軟件組成,可以同時(shí)支持多達(dá)4000個(gè)RTS,每24小時(shí)可以處理多達(dá)100萬個(gè)、時(shí)長(zhǎng)5分鐘的轉(zhuǎn)錄文件。將單臺(tái)x86服務(wù)器上的PCIe加速卡與云ASR服務(wù)的成本相比,第一年的資本支出(CAPEX)和運(yùn)營(yíng)成本(OPEX)就可以降低高達(dá)90%。

欲了解更多信息,請(qǐng)通過網(wǎng)站www.achronix.com/contact-us聯(lián)系A(chǔ)chronix。

參考資料:

https://www.statista.com/statistics/973815/worldwide-digital-voice-assistant-in-use/

https://www.microsoft.com/en-us/research/project/project-brainwave/

Myrtle.ai未發(fā)表的白皮書,關(guān)于在Speedster AC7t1500器件中托管的ASR應(yīng)用

M. Langhammer, G. Baeckler和S. Gribok,《SpiderWeb-高性能FPGA NoC》,2020 IEEE國(guó)際并行和分布式處理研討會(huì)(IPDPSW),2020年,第115-118頁(yè),doi:10.1109/IPDPSW50202.2020.00025。

https://arxiv.org/pdf/2010.06075.pdf

https://aws.amazon.com/transcribe

https://cloud.google.com/speech-to-text

https://www.ibm.com/cloud/watson-speech-to-text

https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service

https://www.techtarget.com/searchenterpriseai/feature/CNN-vs-RNN-How-they-differ-and-where-they-overlap


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉