語音識(shí)別技術(shù)及廠商解析 智能家居的另一大入口?
語音識(shí)別技術(shù)并不是一項(xiàng)新興的技術(shù),并且技術(shù)門檻也不算太高。在需求巨大的智能家居市場(chǎng)語音識(shí)別能否代替智能手機(jī)成為另一大入口?全球范圍內(nèi)哪些廠商在布局語音識(shí)別技術(shù),語音是識(shí)別的技術(shù)原理和難點(diǎn)又在哪?
物聯(lián)網(wǎng)市場(chǎng)潛力巨大應(yīng)用眾多,在繁多的應(yīng)用中智能家居或許能優(yōu)先落地。不過,除了物聯(lián)網(wǎng)標(biāo)準(zhǔn)和觀念阻礙智能家居的發(fā)展,手機(jī)作為目前首要的入口也大大影響了體驗(yàn)。語音識(shí)別并不是一項(xiàng)新興的技術(shù),但在智能家居甚至人工智能領(lǐng)域或許能大展身手。
物聯(lián)網(wǎng)與智能家居市場(chǎng)潛力可期
市場(chǎng)研究咨詢公司Gartner預(yù)測(cè),2020年全球物聯(lián)網(wǎng)終端設(shè)備的出貨量將達(dá)到66億,而物聯(lián)網(wǎng)設(shè)備數(shù)量總數(shù)將達(dá)到208億,花費(fèi)在物聯(lián)網(wǎng)上的總支出將達(dá)到約2420億美元。
Gartner同時(shí)預(yù)測(cè),2017年以后智能家居將成為物聯(lián)網(wǎng)最大的用戶。有機(jī)構(gòu)預(yù)測(cè)2016年中國(guó)智能家居市場(chǎng)規(guī)模增速將達(dá)到50.1% ,并保持這一增速,到2018年中國(guó)智能家居市場(chǎng)規(guī)模將達(dá)到1396億元,市場(chǎng)規(guī)模約占全球總規(guī)模的32%,2020年中國(guó)智能家居市場(chǎng)規(guī)模將達(dá)到3000多億元。全球TOP100電信運(yùn)營(yíng)商中已有60%計(jì)劃進(jìn)軍智能家居市場(chǎng)更讓我們有理由相信智能家居將會(huì)成為最先落地的物聯(lián)網(wǎng)應(yīng)用。
智能家居入口單一
無論是在正式還是非正式場(chǎng)合,談起智能家居總能聽到手機(jī)作為唯一入口的抱怨。舉個(gè)簡(jiǎn)單的例子,當(dāng)你安裝了智能燈具,但你想要打開或調(diào)整還要先找到手機(jī)打開APP。這時(shí)候可能很多人會(huì)選擇直接用開關(guān)解決問題而非使用手機(jī)。
智能家居的愿景很好,但目前的體驗(yàn)確實(shí)還有很大的提升空間。關(guān)于手機(jī)作為智能家居的唯一入口的問題,艾拉物聯(lián)的聯(lián)合創(chuàng)始人、大中華區(qū)總裁Phillip張南雄就表示:“手機(jī)可能不是智能家居甚至物聯(lián)網(wǎng)的唯一入口,語音識(shí)別是一個(gè)很大的入口。”美的智慧總經(jīng)理李強(qiáng)也表示,手機(jī)作為智能家居唯一入口的局面將被改變。
語音識(shí)別成為爭(zhēng)奪焦點(diǎn)
據(jù)悉,全球范圍人工智能公司多專攻深度學(xué)習(xí)方向,而我國(guó)人工智能方向的200家左右的創(chuàng)業(yè)公司有超過70%的公司主攻圖像或語音識(shí)別這兩個(gè)分類。全球都有哪些公司在布局語音識(shí)別?他們的發(fā)展情況又如何?
其實(shí),早在計(jì)算機(jī)發(fā)明之前,自動(dòng)語音識(shí)別的設(shè)想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語音識(shí)別及合成的雛形。最早的基于電子計(jì)算機(jī)的語音識(shí)別系統(tǒng)是由AT&T貝爾實(shí)驗(yàn)室開發(fā)的Audrey語音識(shí)別系統(tǒng),它能夠識(shí)別10個(gè)英文數(shù)字。到1950年代末,倫敦學(xué)院(Colledge of London)的Denes已經(jīng)將語法概率加入語音識(shí)別中。
1960年代,人工神經(jīng)網(wǎng)絡(luò)被引入了語音識(shí)別。這一時(shí)代的兩大突破是線性預(yù)測(cè)編碼Linear PredicTIve Coding (LPC),及動(dòng)態(tài)時(shí)間規(guī)整Dynamic TIme Warp技術(shù)。語音識(shí)別技術(shù)最重大的突破是隱含馬爾科夫模型Hidden Markov Model的應(yīng)用。從Baum提出相關(guān)數(shù)學(xué)推理,經(jīng)過Rabiner等人的研究,卡內(nèi)基梅隆大學(xué)的李開復(fù)最終實(shí)現(xiàn)了第一個(gè)基于隱馬爾科夫模型的大詞匯量語音識(shí)別系統(tǒng)Sphinx。
蘋果Siri
許多人認(rèn)識(shí)語音識(shí)別可能還得歸功于蘋果鼎鼎大名的語音助手Siri。2011年蘋果將語音識(shí)別技術(shù)融入到iPhone 4S中并發(fā)布了Siri語音助理,不過Siri并不是蘋果研發(fā)的技術(shù),而是收購(gòu)成立于2007年的Siri Inc.這家公司獲得的技術(shù)。在iPhone4s發(fā)布以后,Siri的體驗(yàn)并不理想,遭到了吐槽。因此,2013年蘋果又收購(gòu)了Novauris Technologies。Novauris是一種可識(shí)別整個(gè)短語的語音識(shí)別技術(shù),這種技術(shù)并非簡(jiǎn)單識(shí)別單個(gè)詞句,而是試圖利用超過2.45億個(gè)短語的識(shí)別輔助理解上下文,這讓Siri的功能進(jìn)一步完善。
不過Siri并沒有因?yàn)槭召?gòu)Novauris變得完美,2016年蘋果又收購(gòu)了開發(fā)的人工智能軟件,能夠幫助計(jì)算機(jī)與用戶進(jìn)行更為自然的對(duì)話英國(guó)語音技術(shù)初創(chuàng)公司VocalIQ。隨后,蘋果還收購(gòu)了美國(guó)圣地牙哥 AI 技術(shù)公司 EmoTIent,接收其臉部表情分析與情緒辨別技術(shù)。據(jù)悉,EmoTIent開發(fā)的情緒引擎可讀取人們的面部表情并且預(yù)測(cè)其情緒狀態(tài)。