語音助手的發(fā)展將改變用戶的生活方式
(文章來源:百家號)
? ? ? ?汽車的發(fā)展也是越來越迅速了,每一年汽車行業(yè)都有新東西跟大眾見面,而如今的語音交互技術(shù)也是越來越好了,而很多人認為語音交互只是用語音來說話,這實際上是一種誤解。語音交互涉及視覺通道、觸控通道、手勢通道等多通道結(jié)合,只有將各項技術(shù)整合在一起,才能讓用戶體驗逐漸進階:
(1)第一步核心是解決安全問題,解放雙手,避免視線分散。(2)第二步是提高效率,減少學習,解放大腦,讓駕乘者對不同場景及時反饋。(3)再往上進階則講究交互的樂趣,語音可以非常情感化地與人互動,而且可以緩解疲勞,是一種精神的享受。
所以語音助手接下來的發(fā)展方向是衍生出來更多堵車、事故預判及預警、日常關(guān)懷提醒、疲勞駕駛、緊急信息處理等應用場景,進一步改變用戶的用車及生活方式。比如通過場景化的聲音提示及語音互動,降低駕駛過程中的疲勞感,保證行車安全;通過情感化的語氣語調(diào)、聲音娛樂方式,緩解堵車過程中用戶的焦躁情緒,減少駕駛安全隱患;當用戶注意力集中,雙手被占據(jù)的時候,通過語音完成文字內(nèi)容輸入等復雜任務,通過聲音獲得操作反饋,保證行車安全,提高任務效率。
如果說未來的設計趨勢是管家式體驗的話,語音交互對于汽車而言,不僅僅是為了帶給用戶更好的任務操作體驗,而應該在用戶的用車生活中提供更多的情感化互動,提供更多的友好性、趣味性,提升用戶的精神愉悅感,包括基于聲紋識別技術(shù)、方言識別技術(shù)、語音多輪交互、語義理解技術(shù)等,提升語音交互的準確性和效率。
通過對語言理解的深度學習和用戶數(shù)據(jù)分析,針對不同用戶的語言習慣、用車偏好等,增強語音交互體驗的個性化和差異性;未來的交互甚至可以通過語音識別情緒,通過語音識別身份,智能化地引發(fā)汽車的相應反應。
想要做好這些,車載語音系統(tǒng)需要提升哪些核心能力?前期在于自然“語言處理(Natural Language Processing)+自然語言理解(Natural Language Understanding)引擎”的能力,后期在于“數(shù)據(jù)和計算能力+資源整合能力”的提升。過去常有人說,車載語音交互技術(shù)的發(fā)展將會是一個緩慢的發(fā)展過程?,F(xiàn)在看來,至少這一進程比預期來得要快。并且,隨著核心競爭點的逐步轉(zhuǎn)移,聚焦在車載語音交互的領(lǐng)域,大玩家之間的聯(lián)盟會越來越緊密。