你家里有智能語音產(chǎn)品嗎
智能語音語義技術(shù)主要研究人機之間語音信息的處理問題。簡單來說,就是讓計算機、智能設(shè)備、家用電器等通過對語音進行分析、理解和合成,實現(xiàn)人“能聽會說”、具備自然語言交流的能力。
智能語音技術(shù)概述按機器在其中所發(fā)揮作用的不同,分為語音合成技術(shù)、語音識別技術(shù)、語音評測技術(shù)等。語音合成技術(shù)即讓機器開口說話,通過機器自動將文字信息轉(zhuǎn)化為語音,相當于機器的嘴巴。
語音識別技術(shù)即讓機器聽懂人說話,通過機器自動將語音信號轉(zhuǎn)化為文本及相關(guān)信息,相當于機器的耳朵;語音評測技術(shù)通過機器自動對發(fā)音進行評分、檢錯并給出矯正指導。此外,還有根據(jù)人的聲音特征進行身份識別的聲紋識別技術(shù),可實現(xiàn)變聲和聲音模仿的語音轉(zhuǎn)換技術(shù),以及語音消噪和增強技術(shù)等。
智能語音產(chǎn)品和服務(wù)形態(tài)多樣智能語音技術(shù)會成為未來人機交互的新方式,將從多個應用形態(tài)成為未來人機交互的主要方式。
智能音箱類產(chǎn)品提升家庭交互的便利性。智能音箱是從被動播放音樂,過渡到主動獲取信息、音樂和控制流量的入口。當前智能音箱以語音交互技術(shù)為核心,成為作為智能家庭設(shè)備的入口,不但能夠連接和控制各類智能家居終端產(chǎn)品,而且加入了個性化服務(wù),如訂票、查詢天氣、播放音頻等能力。
個人智能語音助手重塑了人機交互模式。個人語音助手,特別是嵌入到手機、智能手表、個人電腦等終端中的語音助手,將顯著提升這類產(chǎn)品的易用性。如蘋果虛擬語音助手 Siri 與蘋果智能家居平臺Homekit 深度融合,用戶可通過語音控制智能家居。Google Now 為用戶提供關(guān)心的內(nèi)容,如新聞、體育比賽、交通、天氣等等。微軟的Cortana 主要優(yōu)勢在于提升個人計算機的易用性。
以 API 形式提供的智能語音服務(wù)成為行業(yè)用戶的重要入口。智能語音 API 主要提供語音語義相關(guān)的在線服務(wù),可包括語音識別、語音合成、聲紋識別、語音聽轉(zhuǎn)寫等服務(wù)類型,并且可以嵌入到各類產(chǎn)品,服務(wù)或 APP 中。在商業(yè)端,智能客服、教育(口語評測)、醫(yī)療(電子病歷)、金融(業(yè)務(wù)辦理)、安防、法律等領(lǐng)域需求強烈;在個人用戶領(lǐng)域,智能手機、自動駕駛及輔助駕駛、傳統(tǒng)家電、智能家居等領(lǐng)域需求強烈。