人工智能如何發(fā)聲
基于語音的虛擬個(gè)人語音助理(VPA)是當(dāng)今音頻行業(yè)的主要驅(qū)動(dòng)力?;谝纛l系統(tǒng)的傳統(tǒng)組件,如音頻編解碼器、麥克風(fēng)、揚(yáng)聲器和音頻放大器,他們都在使用人工智能來計(jì)算和分析語音數(shù)據(jù)。例如計(jì)算支持復(fù)雜的音頻功能,如語音識(shí)別和源定位。它可以在云中執(zhí)行,也可以在消費(fèi)設(shè)備的邊緣處執(zhí)行。這些分析在云中執(zhí)行需要很高的處理能力和訪問大量數(shù)據(jù),。
Yole光電和傳感部門的技術(shù)和市場(chǎng)分析師Dimitrios Damianos表示:“人工智能的附加價(jià)值是用于自然語言處理,聲音是與機(jī)器互動(dòng)的一種更自然的方式。你不需要使用鍵盤和雙手,你只需要發(fā)聲即可。然而,為了理解用戶在說什么,他們的語言以及他們的意思需要進(jìn)行大量的處理?!叭斯ぶ悄苷谠黾咏獯a的價(jià)值,并幫助我們與設(shè)備溝通。”
當(dāng)被問及VPA的快速滲透時(shí),Damianos將其歸因于其便捷性和效率。當(dāng)然,“我們相信和看到的是,像谷歌、蘋果、Facebook、亞馬遜和微軟(統(tǒng)稱為GAFAM)這樣的大型科技公司試圖推動(dòng)這些VPA,因?yàn)樗鼈兲崛〉臄?shù)據(jù)有真正的價(jià)值?!?
Yole公司MEMS和傳感器部門的技術(shù)和市場(chǎng)分析師Alexis Debray:對(duì)于用戶來說,音頻比圖像更容易被接受。他們認(rèn)為音頻“不那么具有侵入性,所以這是GAFAM從人們那里收集數(shù)據(jù)的好方法,GAFAM的主要業(yè)務(wù)就是數(shù)據(jù)。一些公司利用數(shù)據(jù)做生意,而另一些公司利用隱私和設(shè)置技術(shù)來確保用戶的隱私。例如,蘋果公司就宣揚(yáng)隱私,并使之成為強(qiáng)大的營(yíng)銷資產(chǎn)。
Damianos說到:對(duì)大型科技公司來說,它們的實(shí)際價(jià)值是盡可能多地從環(huán)境中提取信息,這意味著VPA不僅會(huì)傾聽用戶的聲音,還會(huì)傾聽他們周圍的環(huán)境,并了解他們的環(huán)境。例如,“如果你在廚房里,麥克風(fēng)可以聽到刀架在柜臺(tái)上的聲音,立刻就知道你在廚房里,并給出一個(gè)菜譜?!边@就是情景人工智能。
人工智能對(duì)話之后的下一個(gè)階段很可能是完全感知,虛擬助手,無論是智能揚(yáng)聲器還是智能手表,都可以像人類一樣與用戶交流。Damianos介紹,完全的意識(shí)是概念性的,并帶有問號(hào)?!拔覀冞€不知道時(shí)間軸,但可能會(huì)在人工智能對(duì)話之后的5到6年。這將取決于人工智能的發(fā)展和該領(lǐng)域公司的發(fā)展。
雖然這些一直監(jiān)聽的系統(tǒng)可以在汽車人機(jī)界面中挽救生命,但它們也引起了人們對(duì)用戶隱私保護(hù)的擔(dān)憂。為了防止可能的誤用,Debray強(qiáng)調(diào),數(shù)據(jù)處理應(yīng)該盡可能快地進(jìn)行,并盡可能靠近麥克風(fēng)?!半x麥克風(fēng)越近,隱私泄露的可能性就越小?!?
隱私包含多個(gè)維度,因?yàn)橛脩艨赡芟M[藏自己的性別、年齡或情緒。展望未來,Debray表示,他有信心麥克風(fēng)、ASIC或應(yīng)用處理器領(lǐng)域的參與者將開發(fā)出確保用戶隱私的技術(shù)。麥克風(fēng)可以消除聲音中的情緒,只呈現(xiàn)音頻數(shù)據(jù)。
Yole分析師預(yù)計(jì),GAFAM將繼續(xù)占據(jù)主導(dǎo)地位,因?yàn)槟壳八鼈儗?duì)分析的作用至關(guān)重要,但傳感器制造商顯然渴望在邊緣加入人工智能,并將音頻分析業(yè)務(wù)從云端分流出去。Damianos:“傳感器制造商希望增加他們的收入,并從音頻市場(chǎng)中分一杯羹。這不是一場(chǎng)來自大公司一方的戰(zhàn)斗。這是傳感器公司的一場(chǎng)戰(zhàn)斗。”
Alexis Debray:“傳感器公司確實(shí)在追求多樣化的戰(zhàn)略,“試圖向價(jià)值鏈移動(dòng),變得更加一體化。”
在最近的一次采訪中,Vesper Technologies Inc.首席執(zhí)行長(zhǎng)Matt Crowley曾表示,Vesper正在尋求提高其壓電MEMS麥克風(fēng)的智能化程度。“我們相信,在未來,我們將在傳感器中嵌入一些與人工智能配對(duì)的傳感器。它將能夠?qū)W習(xí)人類和動(dòng)物如何使用他們的感官——不僅僅是視覺、聽覺、味覺、嗅覺和觸覺,還有動(dòng)作或溫度——來了解他們的環(huán)境。我們的長(zhǎng)期愿景是,這些物體將使用多種仿生傳感器來了解它們的環(huán)境,并盡可能做出最佳反應(yīng)?!?
此外,英飛凌(Infineon AG)也改變了自己的商業(yè)模式,從銷售麥克風(fēng)模類產(chǎn)品轉(zhuǎn)向銷售Goertek和AAC等公司的產(chǎn)品,再到銷售成套的MEMS麥克風(fēng)。從一個(gè)MEMS麥克風(fēng)制造商到一個(gè)做制造、封裝、測(cè)試和銷售的綜合播放器?!斑@是戰(zhàn)略上的變化……這可能意味著,他們看到了VPA的動(dòng)向,希望在這個(gè)市場(chǎng)上找到自己的定位?!?
同樣,美國樓氏電子Knowles,今天的領(lǐng)導(dǎo)者,擁有MEMS麥克風(fēng)市場(chǎng)39%的份額,最近從Ams AG收購了MEMS麥克風(fēng)ASIC設(shè)計(jì)部門。這是引入混合信號(hào)電路設(shè)計(jì)知識(shí)產(chǎn)權(quán)的一種方式,同時(shí)也是應(yīng)對(duì)來自中國公司如Goertek和AAC日益激烈的競(jìng)爭(zhēng)的一種方式。