科大訊飛人工智能的用戶交互界面AIUI
科大訊飛在北京國(guó)家會(huì)議中心舉行了“人工智能+ 共創(chuàng)新世界——2016科大訊飛年度發(fā)布會(huì)”。此次發(fā)布會(huì)展示了科大訊飛人工智能的用戶交互界面AIUI在產(chǎn)品和市場(chǎng)方面的推進(jìn)。
AIUI是科大訊飛研發(fā)的以語(yǔ)音識(shí)別為主,結(jié)合圖像、視覺(jué)及手勢(shì)識(shí)別的人機(jī)交互產(chǎn)品,它的集成包括雙全工技術(shù)、麥克風(fēng)陣列技術(shù)、聲紋識(shí)別技術(shù)、方言識(shí)別、語(yǔ)義理解技術(shù)和和內(nèi)容服務(wù),并能夠與眾多人工智能產(chǎn)品結(jié)合,使得人工智能產(chǎn)品都能在AIUI的界面下進(jìn)行操作。
AIUI自2015年上線以來(lái),在人機(jī)交互方面的應(yīng)用涉及教育、政府、交通等領(lǐng)域。目前,科大訊飛給出的數(shù)據(jù)顯示,AIUI的用戶數(shù)量達(dá)到8.9億,日均使用量30億次。在未來(lái),人機(jī)交互依然是科大訊飛在語(yǔ)音識(shí)別技術(shù)上的重點(diǎn)。
此次發(fā)布會(huì)介紹的主要產(chǎn)品和市場(chǎng)情況如下:
1. 語(yǔ)音聽(tīng)寫(xiě)
AIUI的語(yǔ)音聽(tīng)寫(xiě)功能已經(jīng)能做到直接用語(yǔ)音進(jìn)行修改、翻譯、加標(biāo)點(diǎn),同時(shí)可以記憶人名,響應(yīng)速度在200毫秒以內(nèi),在噪音環(huán)境下的錯(cuò)誤率低至2.24%,并能更加準(zhǔn)確地識(shí)別方言和口音。另外,該語(yǔ)音識(shí)別系統(tǒng)還有針對(duì)涉密場(chǎng)景的加密功能。
目前,AIUI的語(yǔ)音識(shí)別主要運(yùn)用于會(huì)議紀(jì)要的即時(shí)成稿。今年,該語(yǔ)音識(shí)別系統(tǒng)還與最高法深度合作,主要運(yùn)用于庭審記錄??拼笥嶏w方面的數(shù)據(jù)顯示,最高法處理普通案件庭審記錄的時(shí)間,由原先的3小時(shí)加快至5分鐘。
2. 實(shí)時(shí)互譯
科大訊飛的實(shí)時(shí)互譯系統(tǒng)可在網(wǎng)站使用,或下載app,它可以識(shí)別語(yǔ)音,進(jìn)行實(shí)時(shí)翻譯并外放,主要用于同不同語(yǔ)種的人進(jìn)行交流。目前,中維實(shí)時(shí)翻譯系統(tǒng)已經(jīng)出現(xiàn),并在援疆工作中發(fā)揮作用,用于援疆工作人員與新疆少數(shù)民族的人群進(jìn)行交流。
科大訊飛表示,目前公司在漢英互譯領(lǐng)域處于世界領(lǐng)先水平,在未來(lái)還將開(kāi)發(fā)世界主要語(yǔ)言的語(yǔ)音實(shí)時(shí)翻譯系統(tǒng),用于解決不同語(yǔ)種的人交流時(shí)的障礙。
3. 智能家居的人機(jī)交互
科大訊飛與智能家居方面的合作目前集中在電視領(lǐng)域,產(chǎn)品為訊飛電視助理。科大訊飛將自己的語(yǔ)音交互系統(tǒng)植入遙控器,用戶只要對(duì)遙控器說(shuō)出指令,電視就會(huì)做出相應(yīng)的反應(yīng),例如篩選影片、調(diào)整音量等。該產(chǎn)品目前已經(jīng)能夠支持更深度的人機(jī)交互,例如一些更隨意的指令,如“片尾音樂(lè)很好聽(tīng),這是什么歌”,系統(tǒng)便會(huì)顯示歌曲的歌名。
目前科大訊飛在智能家居領(lǐng)域已經(jīng)與3000多家廠商進(jìn)行合作,今年已經(jīng)推出了1000多款產(chǎn)品。在未來(lái),科大訊飛的語(yǔ)音交互系統(tǒng)還將植入更多的智能家居,人們可以用語(yǔ)音控制更多的家電,而不僅限于電視。
4. 車載語(yǔ)音交互系統(tǒng)
科大訊飛車載語(yǔ)音識(shí)別系統(tǒng)的最新產(chǎn)品為飛魚(yú)助手,它僅靠語(yǔ)音對(duì)話就能完成導(dǎo)航、尋找餐廳、播放音樂(lè)、接打電話等功能。這與AIUI的語(yǔ)音識(shí)別支持語(yǔ)音修改、學(xué)習(xí)人名有關(guān)。即便在打電話時(shí),系統(tǒng)根據(jù)語(yǔ)音找到了錯(cuò)誤的通訊錄好友,也可以直接通過(guò)語(yǔ)音進(jìn)行修改。利用飛魚(yú)助手導(dǎo)航時(shí),系統(tǒng)可以識(shí)別地名的簡(jiǎn)稱、別稱等。
未來(lái),科大訊飛希望在自動(dòng)駕駛方向有所進(jìn)展,希望能夠?qū)⒆詣?dòng)駕駛環(huán)境營(yíng)造得更加人性化,這就要求在人機(jī)交互方面更加自然,機(jī)器能夠與人類進(jìn)行更深層次的對(duì)話。
5. 金融服務(wù)機(jī)器人
科大訊飛推出的“曉曼機(jī)器人”目前已經(jīng)運(yùn)用于銀行服務(wù)中。這款金融服務(wù)機(jī)器人能夠識(shí)別用戶的語(yǔ)音指令,并在屏幕上推送相關(guān)的金融服務(wù)。另外,“曉曼機(jī)器人”還可以在銀行大廳內(nèi)為用戶指路,帶著用戶到相應(yīng)窗口辦理業(yè)務(wù)。
6個(gè)性化教育
科大訊飛研發(fā)的自動(dòng)作文評(píng)閱系統(tǒng)已經(jīng)運(yùn)用于四六級(jí)考試的閱卷中,能夠給試卷打分,并提出修改意見(jiàn)。另外,科大訊飛的數(shù)字個(gè)性化推薦教育系統(tǒng),能夠分析考試中各個(gè)題目的錯(cuò)誤率,并列出典型錯(cuò)誤,根據(jù)不同學(xué)生不同的出錯(cuò)情況,推送不同的錯(cuò)題講解,提供個(gè)性化的學(xué)習(xí)內(nèi)容,并節(jié)省了教師統(tǒng)一講解的時(shí)間。目前該系統(tǒng)已經(jīng)運(yùn)用于北師大二附中、黃岡中學(xué)廣州分校等學(xué)校的教育中。
科大訊飛在2014年的12月宣布“訊飛超腦”計(jì)劃,目標(biāo)為讓機(jī)器人在3~5年內(nèi)考上大學(xué)??拼笥嶏w在教育方面推廣的人工智能技術(shù),除了上述功能外,還有一個(gè)目的即是機(jī)器學(xué)習(xí)。通過(guò)匯總所有用戶的知識(shí)和錯(cuò)誤,使機(jī)器不斷認(rèn)知、學(xué)習(xí)、迭代,達(dá)到比人類更高的學(xué)習(xí)效率。至于最終能否完成“3至5年考上大學(xué)”的目標(biāo),目前依然沒(méi)有結(jié)論。
7. 語(yǔ)音模仿
“訊飛配音閣”是科大訊飛在語(yǔ)音模仿領(lǐng)域的主要產(chǎn)品之一,目前手機(jī)app已經(jīng)開(kāi)放下載。這款產(chǎn)品能夠模仿不同人物的聲音,包括音調(diào)音色和說(shuō)話時(shí)的語(yǔ)調(diào)習(xí)慣??拼笥嶏w的語(yǔ)音模仿系統(tǒng)主要運(yùn)用方向?yàn)殡娪芭湟?,即省去演員后期配音的工作,直接讓機(jī)器來(lái)代替演員完成配音工作。另外,普通用戶也可以利用語(yǔ)音模仿系統(tǒng),設(shè)置智能設(shè)備的聲音,例如將手機(jī)講故事的聲音設(shè)置為父母,情侶間設(shè)置對(duì)方的聲音為其路況導(dǎo)航等