智能家電中的語音新技術(shù),一次喚醒連續(xù)對(duì)話
(文章來源:天極網(wǎng))
? ? ?? 語音交互技術(shù)是人工智能領(lǐng)域的一大重點(diǎn),近年來已經(jīng)應(yīng)用到手機(jī)、智能家電、智能硬件等貼近消費(fèi)電子領(lǐng)域。不過在實(shí)際應(yīng)用中,語音操控的體驗(yàn)并不是非常好,仍然有不少痛點(diǎn),繼續(xù)在改善中。
有一個(gè)痛點(diǎn),以前的AI語音是用戶每說一句話都要喊一聲它的名字,如果在下一個(gè)命令前沒有再次叫它,它就不會(huì)反應(yīng)。這樣一來,問幾句話就要叫幾聲,真是很累人。
還好,隨著人工智能語音技術(shù)的進(jìn)步,近半年來推出的一些智能新產(chǎn)品已經(jīng)增加了一種語音新技術(shù):連續(xù)語音,或者叫語音連續(xù)識(shí)別,總之,這一新技術(shù)能夠做到“一次喚醒,連續(xù)識(shí)別,多輪對(duì)話”,能夠解決上面所說的這種慘痛用戶體驗(yàn)。
以小米家的小愛同學(xué)為例,就可以做到一次喚醒,用戶可以連續(xù)發(fā)送語音指令,并且能隨時(shí)打斷它,重新發(fā)出新的指令。米家的一些新產(chǎn)品就已經(jīng)增加了這一功能。百度的AI也有這種一次喚醒多輪對(duì)話的語音功能,并且也實(shí)際應(yīng)用到了其AI音箱中,以及其它跟其合作的智能家電產(chǎn)品中。
創(chuàng)維的智能電視、智能空調(diào)等新產(chǎn)品都具有智能語音功能,他們的AI語音是內(nèi)置了百度的。這些智能家電支持用遙控器發(fā)出語音,還支持遠(yuǎn)場(chǎng)語音,用戶可以直接對(duì)著電視、空調(diào)喊話發(fā)指令來操作。近期推出的一些新品也是增加了連續(xù)識(shí)別功能,在用“小維小維”喚醒AI后,AI會(huì)待命一段時(shí)間,這段時(shí)間里用戶可以一直與AI對(duì)話,不用每交待一個(gè)指令之前都要叫一聲小維喚醒它;如果一會(huì)沒有用戶指令了,AI才會(huì)重新沉睡。實(shí)際的體驗(yàn)相當(dāng)流暢,可以說完全改善了上文所敘述的痛點(diǎn)。
舊的AI語音大多只能進(jìn)行單輪對(duì)話,無法支持多輪對(duì)話,也就是說,AI在你的上一句指令和下一句指令之間建立邏輯聯(lián)系。
單輪對(duì)話是指對(duì)話內(nèi)容不包含情景,沒有關(guān)聯(lián)上下文內(nèi)容。這種對(duì)話模式導(dǎo)致語音交互更偏向于簡(jiǎn)短的操作任務(wù),過于復(fù)雜的操作任務(wù),則需要分解成簡(jiǎn)短的口令。而新的多輪對(duì)話則可以支持在前后幾個(gè)命令間建立邏輯關(guān)聯(lián)。
指令給出的結(jié)果并不是科幻電影中的美國電影,而是又重新進(jìn)行了一次美國電影的搜索。這一結(jié)果當(dāng)然不夠智能。當(dāng)然,這說的是一年以前的舊產(chǎn)品,大約2019年以來的新產(chǎn)品都會(huì)支持多輪對(duì)話了。
除了這些以后,目前還有一些語音技術(shù)未成熟,但如果成熟應(yīng)用的話會(huì)給用戶帶來很多便利。比如說,聲紋識(shí)別,AI可以識(shí)別各個(gè)不同人不同用戶的聲音特點(diǎn),建立用戶檔案,進(jìn)行個(gè)性化推薦,目前這一技術(shù)未大規(guī)模應(yīng)用。
? ? ?