近期,國內(nèi)數(shù)家語音技術(shù)創(chuàng)業(yè)公司陸續(xù)推出了AI語音專用芯片。
5月16日,云知聲在北京發(fā)布了首款面向物聯(lián)網(wǎng)領(lǐng)域的AI系列芯片UniOne以及第一代芯片“雨燕”。
5月24日,出門問問在北京發(fā)布了旗下首款A(yù)I語音芯片模組問芯Mobvoi A1。
昨天,Rokid在杭州發(fā)布了旗下AI語音專用SoC芯片KAMINO18。
而在同一時間,思必馳CEO高始興確認(rèn)公司正在打造AI語音芯片,預(yù)計今年下半年流片。
云知聲、出門問問、Rokid、思必馳,這四家AI語音領(lǐng)域的頭部創(chuàng)業(yè)公司,幾乎都在同一時間開始押注AI語音芯片。
那么,AI專用語音芯片為什么在今年開始爆發(fā)了?
在經(jīng)歷了2017年的小高潮(全球智能音箱銷量突破3000萬臺)之后,國內(nèi)智能音箱市場在今年迎來銷量井噴期,各種百元級智能音箱鋪天蓋地。市場分析公司Canalys預(yù)測,2018年全球智能音箱出貨量將超過5600萬臺,這讓語音交互行業(yè)成為市場的焦點(diǎn)。
圖:亞馬遜Echo系列產(chǎn)品曾引爆智能音箱市場
在這樣大的市場背后,智能音箱中的芯片方案開始由通用芯片轉(zhuǎn)為使用專用語音芯片。比如,在2017年,阿里推出的天貓精靈就使用了聯(lián)發(fā)科MT8516語音芯片,而小米小愛音箱使用的是晶晨A113芯片。
智能音箱之外,在家庭場景、辦公場景中更多的硬件設(shè)備也開始語音化、智能化,這就更加帶動了AI專用語音芯片的爆發(fā)。
這種形勢下,國內(nèi)一眾語音技術(shù)公司憑借自身在語音識別、自然語言處理、語音交互設(shè)計等技術(shù)上的積累,開始轉(zhuǎn)型做AI語音芯片集成及提供語音交互解決方案。而以上提到的四家語音創(chuàng)業(yè)公司——云知聲、出門問問、Rokid、思必馳幾乎都是在這種情況下開始了語音芯片的布局。
那么,AI專用語音交互芯片與通用芯片相比,到底有什么優(yōu)勢呢?
不管是云知聲發(fā)布的面向IoT領(lǐng)域的第一代UniOne芯片“雨燕”,還是出門問問推出的語音芯片模組問芯Mobvoi A1,亦或是Rokid發(fā)布的SoC芯片KAMINO18,都主打高集成度、低功耗、低成本、可定制化等特點(diǎn)。
圖:雨燕芯片架構(gòu)
云知聲的“雨燕”芯片采用CPU+uDSP+DeepNet架構(gòu),且公司稱這些架構(gòu)都是自主研發(fā)的。而出門問問和Rokid則宣布自己的芯片是基于杭州國芯科技芯片深度定制。在接受網(wǎng)易智能采訪時,Rokid CEO Misa確認(rèn)KAMINO18基于40nm工藝的國芯GX8010制造。
圖:出門問問Mobvoi A1芯片
圖:Rokid KAMINO18芯片
另外,國芯科技與思必馳也是合作伙伴,如果不出意外,即將在下半年流片的思必馳AI語音芯片也將基于國芯GX8010打造。
國芯科技在去年底發(fā)布了兩款主打AI語音交互功能的NPU芯片GX8008和GX8010,內(nèi)置Cadence最新的Tensilica HIFI 4 DSP內(nèi)核,主打低功耗、低成本、可離線與集成化。
圖:國芯GX8010
也就是說,國芯科技研發(fā)的AI芯片已經(jīng)提供了數(shù)字信號處理器DSP、神經(jīng)網(wǎng)絡(luò)處理器NPU,以及USB/IIS/IIC/UART等標(biāo)準(zhǔn)接口。出門問問、Rokid等廠商不需要做IP設(shè)計,只需要進(jìn)行架構(gòu)集成,這些集成大多是麥克風(fēng)陣列信號處理、降噪、喚醒技術(shù)、聲紋識別以及一些語音技能。云知聲雖是自研設(shè)計的uDSP和DeepNet架構(gòu),但在功能上與以上兩款芯片基本相當(dāng)。
思必馳CEO高始興近日也透露,下半年將要發(fā)布的AI語音芯片會是一款A(yù)SIC芯片,同時具備聲學(xué)信號處理能力和語音能力,超低功耗,聲學(xué)信號處理能力和擴(kuò)展力都比較強(qiáng)。
芯片之外,這幾家公司都把重點(diǎn)放在提供整體的語音交互解決方案上。其中,云知聲提出了云端芯一體化的解決方案,對接AI云服務(wù)、AI軟件方案商、芯片原廠,還提供一定的開源能力,提供相應(yīng)的定制化工具;出門問問稱要提供一站式軟硬結(jié)合的語音解決方案;Rokid也表示要提供一系列的語音解決方案。
AI專用語音芯片的市場在哪里?
聊到AI專用芯片的市場,一般都會是根據(jù)具體場景的具體產(chǎn)品進(jìn)行定制。對于這幾家做AI專用語音芯片的公司來說,智能音箱、兒童故事機(jī),以及家電產(chǎn)品成為其主打的產(chǎn)品。而找到能夠大規(guī)模定制AI語音芯片的廠商則成為商業(yè)化最關(guān)鍵的一步。
目前,云知聲走的是To B的道路,其合作廠商為京東Alpha平臺以及億咖通科技,與前者合作的目標(biāo)是打造定制化智能標(biāo)桿產(chǎn)品,而與后者是共同研發(fā)汽車前裝車規(guī)級AI芯片。
而在Rokid發(fā)布會上,公司CEO Misa表示,Rokid不是To B公司,而是一家To C(社區(qū))的公司。未來將通過對產(chǎn)品、技術(shù)、市場的研發(fā)和理解,推出平臺及解決方案,搭建生態(tài)及產(chǎn)業(yè)賦能。
圖:Rokid Me便攜音箱
出門問問則將自己定義為一家軟硬件結(jié)合的公司,其正在推出多款不同品類的消費(fèi)級智能硬件產(chǎn)品,除了在智能音箱領(lǐng)域布局,還涉足智能手表、智能耳機(jī)等領(lǐng)域。
圖:小問音箱時尚版TicKasa Nano
但是,以智能音箱為代表的語音交互產(chǎn)品真的能夠撐起這些公司的AI芯片夢嗎?
AI專用語音芯片能否持續(xù)爆發(fā),一方面要看這些芯片能否大規(guī)模應(yīng)用于產(chǎn)品,另一方面還要看這些產(chǎn)品的語音交互能力到底能否得到用戶的青睞和市場的檢驗。
清華大學(xué)微電子所所長魏少軍在接受媒體采訪時曾表示,現(xiàn)在的AI芯片市場被過度炒作。這是因為AI的殺手級應(yīng)用還沒出現(xiàn),不管是智能音箱還是其他產(chǎn)品,都沒有成為一個剛需產(chǎn)品。
因此,只有使語音真正成為人機(jī)交互的一個界面,才能推動AI語音芯片的爆發(fā)。
趁著高通、英偉達(dá)、英特爾等芯片巨頭還沒有進(jìn)入語音芯片市場,此時正是創(chuàng)業(yè)公司在語音芯片領(lǐng)域蒙眼狂奔的好時機(jī)。
總之,云知聲、出門問問、Rokid、思必馳,或許會借這波AI語音芯片熱潮成為AI語音領(lǐng)域的佼佼者,但也有可能成為一場秀。
一切等待市場和時間來檢驗。