www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 嵌入式 > 嵌入式分享
[導讀]從家庭自動化、電子商務(wù)到醫(yī)療保健和汽車,越來越多的行業(yè)正在將物聯(lián)網(wǎng)功能與語音集成結(jié)合起來,以滿足不斷變化的需求,并釋放業(yè)務(wù)優(yōu)勢。然而,語音仍處于采用的早期階段,并剛剛開始向移動設(shè)備和揚聲器之外擴展。語音將成為用戶和他們的物聯(lián)網(wǎng)設(shè)備之間交互的標準方法。這種向語音優(yōu)先的轉(zhuǎn)變不僅僅是基于它在技術(shù)上提高了消費者的舒適度。用于動態(tài)語音搜索的語音設(shè)備的全球移動性、自然語言處理(NLP)的進展以及人工智能和機器學習的進步將使新的應(yīng)用程序能夠快速發(fā)展。

從家庭自動化、電子商務(wù)到醫(yī)療保健和汽車,越來越多的行業(yè)正在將物聯(lián)網(wǎng)功能與語音集成結(jié)合起來,以滿足不斷變化的需求,并釋放業(yè)務(wù)優(yōu)勢。然而,語音仍處于采用的早期階段,并剛剛開始向移動設(shè)備和揚聲器之外擴展。語音將成為用戶和他們的物聯(lián)網(wǎng)設(shè)備之間交互的標準方法。這種向語音優(yōu)先的轉(zhuǎn)變不僅僅是基于它在技術(shù)上提高了消費者的舒適度。用于動態(tài)語音搜索的語音設(shè)備的全球移動性、自然語言處理(NLP)的進展以及人工智能和機器學習的進步將使新的應(yīng)用程序能夠快速發(fā)展。

愉快和吸引人的聲音互動受到一致的噪音和其他干擾物存在的音質(zhì)的限制。你的設(shè)備智能管理聲音的能力決定了你的溝通能力。預計永遠開機的語音用戶界面(VUI)將在更多的消費產(chǎn)品中普及,包括音頻和視頻設(shè)備、白色產(chǎn)品,以及各種電池供電的設(shè)備,如遙控器、可穿戴設(shè)備、藍牙揚聲器、安全設(shè)備和戶外活動攝像頭。雖然有設(shè)計上的挑戰(zhàn)需要克服,但組件供應(yīng)商和OEMS都有很大的機會來交付滿足這些應(yīng)用程序需求的產(chǎn)品。

為了充分利用語音集成機會的成熟,更多的處理技術(shù)正在走向邊緣,遠離云計算。結(jié)果是改進了用戶界面,更低的延遲和成本,包括美元和帶寬。為未來設(shè)計支持物聯(lián)網(wǎng)的CE解決方案的制造商必須考慮將語音集成作為產(chǎn)品特性的先決條件。能夠在邊緣部署專用語音處理的oem將能夠擴展這些應(yīng)用程序并擴展他們的投資組合。

本文討論了在物聯(lián)網(wǎng)始終在上/始終收聽的設(shè)備中實現(xiàn)vui時最常見的挑戰(zhàn)。本文回顧了相關(guān)的需求,以及有效解決這些需求所需的設(shè)計能力,包括與控制接口的集成、軟件堆棧、算法開發(fā)和用戶空間應(yīng)用程序開發(fā)。

將音頻邊緣處理器集成到物聯(lián)網(wǎng)設(shè)備中

專門關(guān)注音頻保真度和機器學習優(yōu)化核心的專用音頻邊緣處理器是支持高質(zhì)量音頻通信設(shè)備的關(guān)鍵。這些處理器可以提供足夠的計算能力來使用傳統(tǒng)算法和ML算法處理音頻,同時使用通用處理器的一小部分能量。由于處理是在設(shè)備上進行的,所以它比將信息發(fā)送回云要快得多。

物聯(lián)網(wǎng)設(shè)備集成了音頻處理器,增加了語音喚醒等豐富的功能。雖然云計算可能會提供一些巨大的好處,但邊緣處理允許用戶在任何時候利用他們的設(shè)備的全部能力,而不需要高帶寬的互聯(lián)網(wǎng)連接。例如,邊緣音頻處理器通過對上下文數(shù)據(jù)進行低延遲處理,在虛擬通信中提供優(yōu)越的用戶體驗,同時保持上下文數(shù)據(jù)的本地和安全。

在集成語音方面所面臨的挑戰(zhàn)

語音通話、控制和交互的應(yīng)用程序機會繼續(xù)增加。然而,隨著更多的設(shè)備,更多的碎片化被引入,這使得集成語音變得更加困難。你如何將語音控制集成到每個應(yīng)用程序中——無論是藍牙揚聲器、家用電器、耳機、可穿戴設(shè)備還是電梯——將會有所不同。添加一個語音喚醒觸發(fā)器可能很簡單,但設(shè)計一個企業(yè)級的藍牙揚聲器和耳機要復雜得多。如果該揚聲器包含了真正的無線立體聲(TWS)集成,那么復雜性就會再次上升。

此外,各種應(yīng)用程序都需要與不同的生態(tài)系統(tǒng)進行語音集成。例如,你需要在Linux生態(tài)系統(tǒng)中工作,才能在大多數(shù)智能電視上實現(xiàn)語音,但要在家用電器上獲得語音,就需要在微控制器(MCU)生態(tài)系統(tǒng)中工作。對于所有這些集成,都有一種常見的推薦方法,但總是有變化,這增加了復雜性。

高質(zhì)量、大眾市場的開發(fā)解決方案對于克服這些挑戰(zhàn)并快速將新技術(shù)推向市場,以支持我們工作、生活和溝通的快速發(fā)展方式至關(guān)重要。為了應(yīng)對這些挑戰(zhàn),合適的解決方案需要解決多種設(shè)計需求。

滿足關(guān)鍵的設(shè)計要求

電力消耗

為了讓VUI設(shè)備接收命令,它必須始終打開/始終偵聽命令。無論這些設(shè)備是否插電,特別是由電池驅(qū)動的,對功耗的限制可能是一個主要的設(shè)計挑戰(zhàn)。為了讓VUI設(shè)備接收命令,它必須始終打開/始終偵聽命令。無論這些設(shè)備是否插電,特別是由電池驅(qū)動的,對功耗的限制可能是一個主要的設(shè)計挑戰(zhàn)。

在語音命令系統(tǒng)中,至少有一個麥克風必須始終是活動的,并且負責識別喚醒字的處理器也必須是活動的。使用專有架構(gòu)、硬件加速器和特殊指令集設(shè)計的音頻邊緣處理器可以最優(yōu)地運行音頻和ML算法。這些優(yōu)化有助于降低功耗。

潛在因素

對語音激活設(shè)備的延遲沒有容忍度。即使有超過200毫秒的感知延遲,人類也會開始在語音通話中互相交談,或者向語音助手重復他們的命令。為了開發(fā)語音集成設(shè)備,將獲得必要的消費者認可,工程師和產(chǎn)品設(shè)計師必須在整個系統(tǒng)中提供優(yōu)化的音頻鏈,以符合行業(yè)規(guī)范和最佳的用戶體驗。因此,邊緣處理器中的低延遲處理是確保高質(zhì)量語音通信的關(guān)鍵要求。

整合

因為在為不同的VUI實現(xiàn)選擇硬件和軟件時,有很多選擇,所以在集成階段的各個階段,有些需求可能會成為一個挑戰(zhàn)。在此過程中需要考慮的一些關(guān)鍵設(shè)計考慮包括下面討論的那些。

硬件集成

根據(jù)設(shè)備的使用情況、應(yīng)用程序和生態(tài)系統(tǒng),有各種硬件架構(gòu)用于實現(xiàn)VUI系統(tǒng)。每個VUI設(shè)備將包括麥克風,單個麥克風或麥克風陣列,連接到一個音頻處理器,用于捕獲和處理音頻。在Khowles最近的一篇嵌入式文章中,我的同事回顧了實現(xiàn)VUI系統(tǒng)的硬件架構(gòu)考慮事項,以及每個系統(tǒng)的優(yōu)缺點。

主機軟件集成

如上所述,有不同的操作系統(tǒng)和驅(qū)動程序可供選擇。理想情況下,音頻處理器將配備固件和一組配置為與主機處理器連接的驅(qū)動程序。該操作系統(tǒng),如Android或Linux,通常運行在主機處理器上。

在內(nèi)核空間中運行的驅(qū)動程序軟件組件通過控制接口與固件進行交互,而來自音頻邊緣處理器的音頻數(shù)據(jù)可以通過標準的高級Linux音頻架構(gòu)(ALSA)接口在用戶空間中讀取。

要將軟件與主機系統(tǒng)的其他部分集成,將軟件發(fā)布包中提供的音頻處理器驅(qū)動程序連接到內(nèi)核映像中可能成為一項復雜的工作。這包括將驅(qū)動程序源代碼復制到內(nèi)核源樹中,更新一些內(nèi)核配置文件,并根據(jù)相關(guān)的硬件配置添加設(shè)備樹條目。

解決這個問題的一種方法是使用具有精確或類似配置的預集成的標準參考設(shè)計。

在理想的情況下,音頻邊緣處理器將為集成提供簡化的軟件堆棧,并提供預集成和驗證的算法作為系統(tǒng)級解決方案,以進一步簡化過程。

算法集成

當我們講在算法集成的主題上時。通常有多個算法級聯(lián),在任何給定的時間在不同的用例之間切換。即使是對于語音喚醒,一個設(shè)計也需要多麥克風波束形成器、一個邊緣語音喚醒引擎和基于云的驗證。這意味著至少有三種算法一起工作來優(yōu)化性能。對于任何集成了Alexa或谷歌Home關(guān)鍵字的設(shè)備,必須有多種算法,通常來自不同的供應(yīng)商,必須在一個設(shè)備中一起進行優(yōu)化。

一種解決方案是選擇一個音頻邊緣處理器,它預先集成了經(jīng)過驗證的算法,開發(fā)和測試獨立于主機系統(tǒng)。

形式因素集成

今天的設(shè)備可以采取很多形式的因素。每個設(shè)備都有自己的多個麥克風安裝的配置。麥克風和揚聲器的距離和位置在表演中起著重要的作用。性能調(diào)整和優(yōu)化必須根據(jù)最終的形式因素和目標用例進行更改。還有一些影響性能的制造變化,如麥克風密封,設(shè)備上的聲學處理,振動抑制等。

隱私

許多音頻處理器檢測到喚醒字,然后立即將信息發(fā)送到云,在那里它被解釋和采取行動。一個大問題是,一旦音頻數(shù)據(jù)出現(xiàn)在云中,用戶就無法控制這些數(shù)據(jù),因此就會暴露在很高的隱私風險中。解決這一挑戰(zhàn)的方案是選擇一個邊緣AI智能處理器,可以在設(shè)備上“在邊緣”執(zhí)行命令解釋和響應(yīng)邏輯。

這使得敏感的個人音頻數(shù)據(jù)保持本地,而不會被發(fā)送到云,在那里它可以違背我們的意愿使用。VUI的實現(xiàn)現(xiàn)在不僅更加私有,而且可以更快地響應(yīng),使用戶的交互更加自然。這是一個很好的例子,說明了邊緣人工智能處理器如何推進現(xiàn)有的用例,以最大限度地提高我們每天使用和信任的設(shè)備的幫助性。

硬件和軟件接口

VUI實現(xiàn)的設(shè)計要求可能很復雜,并使將具有語音集成的設(shè)備快速推向市場具有挑戰(zhàn)性。oem和系統(tǒng)集成商可以通過使用標準解決方案開發(fā)工具包,如諾爾斯AISonic藍牙標準解決方案工具包,從而大大降低風險。這些工具包為原型提供了預先配置的起點,允許設(shè)計師在上面開發(fā)他們自己的創(chuàng)新,而不必擔心我們上面討論的設(shè)計挑戰(zhàn)。設(shè)計人員應(yīng)該尋找具有預集成和驗證過的算法的開發(fā)工具包、預配置的麥克風和與主機處理器和操作系統(tǒng)兼容的驅(qū)動程序。

打開其架構(gòu)和開發(fā)環(huán)境的音頻邊緣處理器,通過為音頻應(yīng)用程序開發(fā)人員提供創(chuàng)建新設(shè)備和應(yīng)用程序的工具和支持,從而加速了創(chuàng)新。未來的音頻設(shè)備將是一種合作的努力。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉