全球首個(gè)AI合成女主播上崗,背后有哪些“黑科技”?
全球首個(gè)“女主播”自從誕生之日就受到了廣大網(wǎng)友的激烈討論,它到底是個(gè)怎么樣的“人”呢?它能干什么呢?
近日,全球首個(gè)AI合成女主播“新小萌”正式上崗新華社,而她的第一個(gè)工作任務(wù),便是參與到當(dāng)下最熱門的十三屆全國人大二次會(huì)議報(bào)道中。對(duì)此,“眾多海外媒體進(jìn)行了大幅報(bào)道,并表示“近年來,中國已成為全球領(lǐng)先的人工智能發(fā)展中心之一”。作為第一個(gè)登上兩會(huì)的AI合成女主播,人們?cè)隗@嘆和稱贊之余,對(duì)于其背后由搜狗所開發(fā)的人工智能技術(shù)都無比好奇:這個(gè)在鏡頭前播報(bào)新聞的“新小萌”,是如何誕生的呢?它未來又將有哪些應(yīng)用價(jià)值呢?
人們?cè)诳匆曨l新聞是希望看到的是一個(gè)有表情親切的真人形象,而不是看著機(jī)器人千篇一律的冰冷面孔。所謂AI合成主播,顧名思義,指的就是依靠搜狗的“分身”技術(shù),來模擬出一個(gè)類似人類的AI主播進(jìn)行播報(bào)。搜狗的這款產(chǎn)品就是以新華社主播屈萌為原型,靠少量用戶真實(shí)音視頻數(shù)據(jù),即可快速定制出高逼真度的分身模型,足以以假亂真。從實(shí)際視頻來看,栩栩如生的AI合成女主播“新小萌”,在鏡頭前的形象與真人主播幾乎沒有什么區(qū)別。
它是通過人臉關(guān)鍵點(diǎn)檢測(cè)、人臉特征提取、人臉重構(gòu)、唇語識(shí)別、情感遷移等多項(xiàng)前沿技術(shù),并結(jié)合語音、圖像等多模態(tài)信息進(jìn)行建模訓(xùn)練后,生成與真人無異的AI分身模型,進(jìn)而幫助人類提高信息表達(dá)和傳遞的效率。AI合成主播不僅可以將新聞稿快速轉(zhuǎn)化為播報(bào)視頻,還能快速學(xué)習(xí)用戶音色、韻律、情感等多維度特征,妥善處理聲調(diào)起伏、語言風(fēng)格、情感韻律等,并提供全天候不間斷的播報(bào)服務(wù),極大地提高廣電行業(yè)的傳播效率。
為不同職業(yè)賦能,搜狗分身的未來遠(yuǎn)不止于主播。未來,“搜狗分身”技術(shù)還將應(yīng)用于娛樂、醫(yī)療、健康、教育、法律、金融等多個(gè)領(lǐng)域,通過提供個(gè)性化的行業(yè)解決方案,為不同場(chǎng)景展開賦能。那個(gè)時(shí)候,各行各業(yè)都將迎來AI技術(shù)下的新一輪變革。