搜狗率先發(fā)布個(gè)性化語音識(shí)別技術(shù)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來源:CCTIME飛象網(wǎng))
搜狗最新推出的“個(gè)性化語音識(shí)別”服務(wù),在語音輸入識(shí)別準(zhǔn)確率及識(shí)別速度方面實(shí)現(xiàn)全面提升。此次產(chǎn)品升級后,基于搜狗領(lǐng)先的語音識(shí)別技術(shù)及為用戶制定的專屬詞匯庫,搜狗語音輸入就像擁有了“讀心術(shù)”,大幅提升了語音識(shí)別準(zhǔn)確率,降低了用戶在語音輸入后的手動(dòng)調(diào)整率。這一“超能力”讓用戶直呼搜狗輸入法越來越“懂人心”。
語音擴(kuò)展了手機(jī)輸入法的場景適用范圍,支持用戶在不方便手動(dòng)輸入的情況下,一鍵語音錄入文本內(nèi)容。由于語音識(shí)別的精準(zhǔn)度會(huì)直接影響用戶使用頻率和使用場景,因此,如何有效提高語音識(shí)別的準(zhǔn)確性,是輸入法行業(yè)的尖端技術(shù)之爭。搜狗此次突破此技術(shù)難關(guān),在語音輸入領(lǐng)域率先推出“個(gè)性化語音識(shí)別”,大幅優(yōu)化了用戶在語音內(nèi)容錄入時(shí)的使用體驗(yàn)。
同音詞組、用戶慣用語、口頭禪等一直是語音輸入的“重災(zāi)區(qū)”,搜狗輸入法的“個(gè)性化語音識(shí)別”可切實(shí)解決這一類問題。比如,當(dāng)用戶語音錄入“cheng zhi”時(shí),輸入結(jié)果顯示“誠摯、橙汁、懲治”等大眾通用詞匯的概率比較大,一般對于人名“程志”的敏感度則不高?!皞€(gè)性化語音識(shí)別”在AI語音識(shí)別技術(shù)及大數(shù)據(jù)融合的基礎(chǔ)上,挖掘用戶個(gè)性化內(nèi)容,可有效提升具備個(gè)人特色詞句的識(shí)別準(zhǔn)確率,降低用戶語音輸入過程中的手動(dòng)修改率,讓用戶在日常生活中表達(dá)、傳遞信息的效率再次提高。
市場上大部分智能設(shè)備都支持語音喚醒功能,這是語音識(shí)別技術(shù)的第一階段“聽懂”,將“聽懂”的語音轉(zhuǎn)換成相應(yīng)的文字,同時(shí)還要保證轉(zhuǎn)換的準(zhǔn)確性,這是語音識(shí)別技術(shù)的第二個(gè)階段“讀心”。
第一階段“聽懂”已經(jīng)在各行業(yè)中發(fā)展成熟,是因?yàn)榻?jīng)過算法輔助和程序糾正,即使機(jī)器獲取的語音素材不那么完整,也能理解語音基本含義,并作出相應(yīng)反應(yīng)。第二階段“讀心”難在如何對用戶個(gè)人的語音進(jìn)行精準(zhǔn)識(shí)別,以使另一方在接受信息時(shí),不會(huì)因?yàn)椤拔谋净狻碑a(chǎn)生誤解。
目前,搜狗通用語音識(shí)別已全面引入了行業(yè)前沿的深度學(xué)習(xí)技術(shù),其中基于DTSS(Deep Transformer-based Sequence to Sequence model)的端到端聲學(xué)模型、神經(jīng)網(wǎng)絡(luò)語言模型和智能標(biāo)點(diǎn)預(yù)測等技術(shù),可有效推動(dòng)搜狗語音識(shí)別的通用效果和體驗(yàn),在行業(yè)中處于領(lǐng)先地位。此次“個(gè)性化語音識(shí)別”針對用戶的語音輸入習(xí)慣進(jìn)行精準(zhǔn)優(yōu)化,從而使得在保障通用識(shí)別準(zhǔn)確性的情況下,還可將用戶常用語詞組錯(cuò)誤率相對下降近40%,實(shí)現(xiàn)語音識(shí)別第二階段“讀心”的至關(guān)技術(shù)突破。
語音輸入是人與機(jī)器實(shí)現(xiàn)溝通的橋梁,現(xiàn)如今,人工智能科技發(fā)展迅速、滲入領(lǐng)域遼闊,AI智能科技產(chǎn)品種類不斷豐富,這些都意味著輸入領(lǐng)域需要更高精尖輸入技術(shù)的革新。搜狗輸入法在開創(chuàng)初期最大的特點(diǎn)是實(shí)現(xiàn)了輸入法和互聯(lián)網(wǎng)的結(jié)合,一直以來對于互聯(lián)網(wǎng)科技的發(fā)展趨勢都有著靈敏的嗅覺,“個(gè)性化語音識(shí)別”正是順應(yīng)新潮流的智慧科技產(chǎn)物。
不難想象,在人工智能普及的未來,通過搜狗語音個(gè)性化資源的實(shí)現(xiàn),可有效提高用戶人機(jī)自然交互的語音轉(zhuǎn)化。除此之外,“個(gè)性化語音識(shí)別”還可根據(jù)用戶私人特征和性格習(xí)慣,在智能家居、智能教育、智能醫(yī)療等與大眾日常生活息息相關(guān)的各個(gè)產(chǎn)業(yè)領(lǐng)域,為用戶構(gòu)造專屬習(xí)慣用語詞庫,為用戶打造與AI智能設(shè)備最輕松的語音環(huán)境。
從大眾化到個(gè)性化,從滿足普遍適用到細(xì)化私人特征,在人工智能、機(jī)器學(xué)習(xí)引領(lǐng)的智慧科技時(shí)代,精準(zhǔn)個(gè)性化用戶服務(wù)是每個(gè)互聯(lián)網(wǎng)科技產(chǎn)品的剛需。從“聽懂”到“讀心”,搜狗“個(gè)性化語音識(shí)別”增強(qiáng)了輸入法產(chǎn)品的私人屬性,滿足了用戶個(gè)性特征的表達(dá),可賦能科技時(shí)代智慧輸入法新理念。