近日,微軟的一份聲明表示,語音識別技術(shù)的精準(zhǔn)性已經(jīng)能媲美人類。微軟 CEO 薩提亞·納德拉認(rèn)為,這一新突破對計算機行業(yè)的意義不亞于圖形用戶界面,不久后,這種能力將會普及到整個計算機行業(yè)中。
國內(nèi)錘子M1發(fā)布會現(xiàn)場,科大訊飛的語音識別技術(shù)快速、精準(zhǔn)地將羅永浩講出的話翻譯成文字,引起滿堂喝彩。
媒體報道,百度與美國斯坦福大學(xué)合作推出的語音輸入App ,其比手動輸入快3倍,準(zhǔn)確性也更高。
近期發(fā)生的上述三大事件,成功引起了市場對語音識別技術(shù)的關(guān)注。
網(wǎng)絡(luò)安全時代,為何語音識別技術(shù)不溫不火?
隨著互聯(lián)網(wǎng)技術(shù)不斷普及,我們迎來了網(wǎng)絡(luò)安全時代,生物識別技術(shù)也有了用武之地。
目前,生物識別技術(shù)中,指紋識別應(yīng)用最為成熟,且生命力旺盛。
手機廠商熱衷于讓指紋識別技術(shù)充當(dāng)解鎖或支付的功能,盡管這一技術(shù)還存在手指脫皮就無法識別的問題,但手機廠商并未放棄它。小米最新旗艦手機小米 5S 甚至還推出了超聲波指紋識別技術(shù),解決了這一問題。
除此之外,媒體報道,蘋果全新的兩款 Macbook ,也將在電源鍵中集成 Touch ID ,以供用戶指紋解鎖。
人臉識別方面,隨著支付寶的大力推廣,其在互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用前景十分美好。
虹膜識別技術(shù),是生物識別領(lǐng)域的“黑科技”,識別精準(zhǔn)度更高,在對安全有極高要求的場景下,這一技術(shù)同樣有發(fā)展的空間。
與之相比,語音識別技術(shù)則發(fā)展的不溫不火。究其原因,應(yīng)用場景尷尬是其中之一。畢竟,比手指接觸設(shè)備、紅外線掃描人臉或虹膜的方式相比,語音識別需要通過發(fā)聲的方式進(jìn)行,這樣在有人或者無人的場景下,這種進(jìn)行身份認(rèn)定的方式都讓人覺得怪怪的。
找準(zhǔn)應(yīng)用場景,語音識別潛力無限早前,重視互聯(lián)網(wǎng)安全的環(huán)境下,語音識別沒有發(fā)展的機會。隨著物聯(lián)網(wǎng)技術(shù)與人工智能技術(shù)不斷落地,語音識別迎來了生機。
盡管在解鎖、支付方面,語音識別依舊難以普及,不過,語音識別將語言轉(zhuǎn)換成文字或者命令的獨特屬性,有望助力其在更多場景中發(fā)揮作用。
比如,科大訊飛與百度的語音輸入,將語言轉(zhuǎn)換成文字,這是其他幾大生物識別技術(shù)都無法處理的事情。以此作為出發(fā)點,未來語音識別將能用在寫作與出版領(lǐng)域。
至于語音轉(zhuǎn)換成命令方面,語音識別技術(shù)可以做的事情就更多了,比如在消費娛樂領(lǐng)域,VR游戲正是風(fēng)尚,引入語音識別技術(shù)后,玩家可拋棄游戲手柄,真正做到沉浸式的體驗當(dāng)中。
又比如在微軟小娜、蘋果 Siri ,智能家居、車聯(lián)網(wǎng)等領(lǐng)域中,成熟的語音識別技術(shù)將可讓機器人迅速理解你的指令,并采取相應(yīng)的措施,生活智能化程度得到極大提高。
要指出的是,在語音轉(zhuǎn)換文字、語音指令方面,語音識別還存在準(zhǔn)確率待提高、延時等瓶頸,不過隨著語音識別技術(shù)不斷提升,這些問題在未來可以不斷得到改善,語音識別市場潛力還將繼續(xù)上升。
研究機構(gòu)指出, 2015 年全球語音識別市場規(guī)模約為 61.9 億美元,預(yù)計到2020年可以接近 200 億美元。