語音智能的時代來臨,誰才能執(zhí)這個新領(lǐng)域的牛耳?
“如果你錯過了2014年的智能手表,2015年的VR眼鏡,2016年的共享單車等智能硬件的創(chuàng)新風(fēng)口,那你在2017年,一定不能錯過智能音箱”。果真如此嗎?
如果說早幾年前AMA-ZON ECHO的發(fā)布還只是在海外掀起一股“智能音箱”的風(fēng)潮,那最近一年來你會發(fā)現(xiàn)姍姍來遲的國內(nèi)市場,也一下子涌現(xiàn)出了一大批類似的產(chǎn)品,在“海量在線音樂庫”,“陪你聊天”,“幼兒早教”等各種功能的包裝下,京東、小米、喜馬拉雅、百度等等一批新貴大鱷都紛紛出品自己的智能音箱產(chǎn)品,而更有傳聞在深圳南山區(qū)一公里范圍內(nèi)有112家做語音智能解決方案和產(chǎn)品的公司,可謂在智能硬件領(lǐng)域,又迅速刮起了一股新風(fēng)。
的確,這是一個不容忽視的風(fēng)口。隨著硬件處理能力的提升,云端能力的提高,語音識別的自我學(xué)習(xí)和智能化水平突飛猛進(jìn),現(xiàn)在的很多語言識別技術(shù)已經(jīng)比較完美地實現(xiàn)輸入速度和準(zhǔn)確率的平衡,達(dá)到實用的程度。而從應(yīng)用場景上看,在家庭環(huán)境中使用語音智能是有其剛需性的,比如躺著床上,不用動手找遙控器或者開關(guān),而只要說一聲開燈,智能設(shè)備就會識別你的要求而完成開燈的動作。人類為家庭生活而進(jìn)行的諸多創(chuàng)造發(fā)明其實都為了一個目的—更加慵懶,所以動嘴比動手更讓人感覺方便,更符合慵懶的趨勢。因此無論從技術(shù)角度還是應(yīng)用角度,“語音智能”都是下一個不容錯過的風(fēng)口。
但為什么在眾多可能可以加載“語音智能”的設(shè)備中,國內(nèi)的創(chuàng)業(yè)者和大公司們都會紛紛看重“智能音箱”這個載體呢?一方面當(dāng)然有仿照的可能,海外有亞馬遜率先推出的ECHO取得不菲的成效,說明市場和客戶的確需要這樣一款產(chǎn)品,那就直接照copy到國內(nèi),這樣減少了創(chuàng)新的風(fēng)險。
另一方面也的確因為“聽音樂”是個普遍性很強的需求,而大家也都習(xí)慣了用手機在網(wǎng)上搜索和下載音樂,這讓傳統(tǒng)的CD載體的音箱失去了部分吸引力,尤其是那些對于音質(zhì)要求不高的非發(fā)燒友,他們在乎的是能聽到更多新歌和好聽的歌,而具備聯(lián)網(wǎng)功能,可以用語音識別進(jìn)行搜索的音箱,剛好滿足了他們的需求,這也給語音智能創(chuàng)造了一個合乎邏輯的場景和載體。這也是為什么京東和科大訊飛推出的“玲瓏”音箱,百度和小魚在家推出了“看家魚”設(shè)備,小米也推出了一款幾百元檔次的米家音箱。大家都把這個設(shè)備當(dāng)成語音智能應(yīng)用的第一個切入點和試金石。
在未來的“語音智能”風(fēng)口中,到底進(jìn)入哪個細(xì)分領(lǐng)域,是創(chuàng)業(yè)者們需要考慮的。第一個領(lǐng)域是“語音識別”,該技術(shù)作為整個智能化中比較核心的科技,目前還掌握在少數(shù)公司手中,而其識別的算法是需要大量測試開發(fā)積累出來的專利,這也決定了最終語音識別的成功率和可用性。雖然目前看進(jìn)入這個領(lǐng)域的公司不多,而且大家都知道需要很強的技術(shù)能力和較長的研發(fā)周期,但隨著人工智能技術(shù)的發(fā)展,自我學(xué)習(xí)能力較強的識別技術(shù)的出現(xiàn),會大大顛覆現(xiàn)在基于采樣統(tǒng)計方式進(jìn)行的語音分析和識別,這對于一些有技術(shù)能力的大公司而言,無疑是很有吸引力的。
第二個領(lǐng)域是“基于語音智能的核心硬件”,這就如同之前所言的“智能音箱”,一是這類硬件需要有一定的便利性,貼近生活和主人的高頻使用與接觸;二是也需要有創(chuàng)新性,加入語音識別的輸入和聯(lián)網(wǎng)功能后,提供豐富的在線內(nèi)容和便捷的人機交互是超越傳統(tǒng)類似產(chǎn)品的基礎(chǔ);三是還要有可拓展性,未來利用這個主要的核心硬件,要能實現(xiàn)對于更多家庭設(shè)備的控制和聯(lián)系;四是并不高昂的價格帶來的較強的性價比。但“音箱”是不是這個風(fēng)口中最為合適的核心硬件載體呢?也許從目前看答案是肯定的。環(huán)顧家里,可能你也找不出更適合加載“語音智能”的其他小家電,何況設(shè)計得好看的音箱,本身也是一件不錯的藝術(shù)品和擺設(shè),不會讓人覺得礙眼。
第三個領(lǐng)域就是“連接核心硬件的周邊產(chǎn)品”,決定一個“語音智能”設(shè)備價值的,不僅僅是這個設(shè)備本身,還有它可以連接和控制的周邊產(chǎn)品,周邊產(chǎn)品越多越豐富,則價值越大。目前來看,這個“生態(tài)鏈”是混亂的,缺乏統(tǒng)一標(biāo)準(zhǔn)、缺乏互聯(lián)互通讓家里可能未來有不少“智能設(shè)備”,但卻更像一個個智能孤島,缺乏統(tǒng)一的聯(lián)系,無法協(xié)同工作。而這種生態(tài)鏈的打法目前看還未成形,小米可能有這樣的雛形,京東微聯(lián)也有這樣的想法,再加上在外圍垂涎三尺的運營商和各大家電企業(yè),大家都想成為標(biāo)準(zhǔn)的制定者,從而統(tǒng)領(lǐng)周邊產(chǎn)品,從而形成生態(tài)閉環(huán),但消費者卻恰恰從這些混戰(zhàn)中,沒有看到更為明朗的前景。
第一個領(lǐng)域難進(jìn),第三個領(lǐng)域混亂而不太成熟,這也是為什么“智能音箱”成為目前“語音智能應(yīng)用”風(fēng)口上率先飛起來的豬了。不過風(fēng)過后,水褪去,才是真正檢驗誰是裸泳者的時刻,與智能手表、智能水杯、VR眼鏡、共享單車等一樣,經(jīng)歷過混沌期的燥熱后,慢慢沉淀下來的,可能只有幾家公司而已。