百度發(fā)布AI輸入法:語音識別精度提升15%支持凌空手寫
1月16日,百度召開新品發(fā)布會,宣布百度輸入法AI探索版正式發(fā)布,這是一款默認(rèn)輸入方式為全語音輸入,并調(diào)動表情、肢體等全感官輸入的產(chǎn)品。
據(jù)了解,百度首先宣布了在語音技術(shù)方面取得的突破,流式截斷的多層注意力建模(SMLTA)已經(jīng)將在線語音識別精度提升了15%,這一技術(shù)能夠解決傳統(tǒng)Attention模型在識別中的時延性,以及因此導(dǎo)致的無法進行大規(guī)模在線語音實時交互的問題。
在離線語音識別方面,百度優(yōu)化了Deep Peak 2系統(tǒng),讓離線語音輸入相對準(zhǔn)確率得以高于行業(yè)平均水平。此外,中英文混合語音輸入技術(shù),以及方言與方言、方言與普通話的混合語音輸入等百度AI輸入法都針對性進行了優(yōu)化。
在新玩法方面,百度輸入法AI探索版推出了拍立活、秀場、凌空手寫等新功能,“拍立活”功能可以讓用戶通過自己的動作“驅(qū)動”對方做出相同表情;“秀場”功能運用了圖像分割技術(shù),用戶可以“穿越”到不同的虛擬場景之中;凌空手寫,可以讓在空中書寫也能被識別。
本次發(fā)布會,百度還介紹了百度海外輸入法的相關(guān)情況,展示了日語識別、印地語識別和印英混輸功能。據(jù)第三方數(shù)據(jù)顯示,百度日文輸入法Simeji的語音識別結(jié)果用戶可接受度占比90%;在文盲率高達30%的印度地區(qū),百度海外輸入法推出的印英混輸識別功能使用率21%。
據(jù)悉,截至2018年底,百度輸入法月活躍人數(shù)為5億,語音日請求量峰值5.5億,AR表情使用次數(shù)1億。海外輸入法全球安裝量1億,支持120種語言。