www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 搜狗AI進(jìn)化之路:從應(yīng)用為王,到顛覆式創(chuàng)新 5月25日,成都,“高曉松”聲音響徹會場,歡迎聽眾參會: 大家好,歡迎來到極客公園2019年現(xiàn)場和大家一起分享人和機(jī)器的共創(chuàng)未來。

搜狗AI進(jìn)化之路:從應(yīng)用為王,到顛覆式創(chuàng)新

5月25日,成都,“高曉松”聲音響徹會場,歡迎聽眾參會:

大家好,歡迎來到極客公園2019年現(xiàn)場和大家一起分享人和機(jī)器的共創(chuàng)未來。

但實(shí)際站在舞臺中央的人,卻是王小川。

王小川,搜狗CEO,成都七中知名校友,中國互聯(lián)網(wǎng)進(jìn)程里最知名的川娃子,中學(xué)時代就打響了IT天才名氣,后來又在歷史際會創(chuàng)造出一方天地。

現(xiàn)在,因一場活動,王小川帶著一項全球領(lǐng)先的技術(shù)再次回到成都,沒錯,就是那一聲“高曉松”的歡迎。

因?yàn)樗诿朊腌娊?jīng)過手機(jī)App前,還是王小川的原聲。

搜狗“變聲”,顛覆性進(jìn)展

通過計算機(jī)合成某一個人的“聲音”,自然在AI江湖里算不上什么。

但如果真正實(shí)現(xiàn)“千人千聲”也能瞬間“遷移”,并且在小小手機(jī)上實(shí)現(xiàn),那確實(shí)得豎大拇指。

因?yàn)槿駻I第一大廠,Google,也還沒做到。

就在一年一度亮肌肉的Google I/O上,也有“變聲”方面的進(jìn)展演示,但體現(xiàn)的是一種語料輸入到另一種語料輸出的“平行遷移”。

更AI的方式來說,one to one,從指定A到指定B.

但像王小川展示,無論說話者是誰,無論說什么,不用考慮說話人的特點(diǎn)(如王小川的“川普”),最后能夠?qū)ⅰ叭我庹f話人”音色實(shí)時高逼真度變換到“指定說話人”音色,則是 Any to one.

該過程中,不光是輸入輸出兩端的映射關(guān)系變化,更是技術(shù)實(shí)現(xiàn)難度上指數(shù)級提升。

因?yàn)楹诵膯栴}在于,每一個人的音調(diào)、音色和語言節(jié)奏都不盡相同,正如同世上沒有兩片相同的樹葉一樣,世上也沒有兩個完全相同的說話人。

如何將“千人千聲”通過技術(shù)處理,變?yōu)橥环N指定聲音,同時還不丟失原說話人的語言習(xí)慣?

離不開展現(xiàn)真正技術(shù)的語音表征學(xué)習(xí)和遷移學(xué)習(xí)的突破,簡要來說三步:

首先,使用表征學(xué)習(xí)技術(shù)學(xué)習(xí)到源端說話人語音的音色、內(nèi)容和韻律(講話節(jié)奏、情感語氣等信息)三大特征。

其次,將學(xué)習(xí)到的源端說話人音色特征替換成目標(biāo)說話人。

最后,基于新的語音變聲技術(shù),使用內(nèi)容(源端)、韻律(源端)、音色(目標(biāo)端)三類特征,合成最終生成變聲音頻。

所以大會現(xiàn)場,王小川的“說”到高曉松的“聲”,實(shí)際經(jīng)歷了這樣的過程。

然而,這樣一短句,實(shí)現(xiàn)背后也有數(shù)千層深度學(xué)習(xí)網(wǎng)絡(luò)的努力。

如表征學(xué)習(xí)使用,上圖所示,A部分對目標(biāo)音色語料進(jìn)行聲紋特征編碼,提取說話人的音色embedding。

B和C分別從輸入音頻中學(xué)習(xí)內(nèi)容和韻律embedding,通過“說話人歸一化”模塊對內(nèi)容embedding進(jìn)行統(tǒng)一規(guī)整,去除音色信息,通過對音頻特征的壓縮編碼及特征抽取,學(xué)習(xí)表征韻律的風(fēng)格特征。

而語音變聲,基于表征學(xué)習(xí)得到的特征,通過Attention和Decoder模塊進(jìn)行加權(quán)特征編碼,并利用WaveRNN神經(jīng)網(wǎng)絡(luò)聲碼器恢復(fù)成波形,最終得到帶有目標(biāo)音色的音頻。

當(dāng)然,最具現(xiàn)實(shí)意義也最具技術(shù)挑戰(zhàn)的還是落地。

這也是搜狗突破稱得上顛覆性的原因這是全球首次將如此難度的變聲能力落實(shí)到消費(fèi)級產(chǎn)品中。

并且還不是自家用軟件專門定義打造的終端硬件,而是融會貫通到小小“搜狗輸入法”App中。

通過App,無論安卓還是iOS,無論什么品牌、何種價位的手機(jī),都能實(shí)現(xiàn)“變聲”,實(shí)時遷移成“表情語音包”。

未來應(yīng)用自然不止于此。

語音屆的“換臉”術(shù)

之前,Deepfakes帶動的“換臉”已經(jīng)實(shí)現(xiàn)了風(fēng)靡,嗶哩嗶哩就出現(xiàn)了不少楊冪主演的《射雕英雄傳》,惟妙惟肖,真假難辨。

但相比換臉的道德問題和法律危機(jī),“變聲”卻能立竿見影創(chuàng)造價值。

凡有音頻處,皆能讓AI變聲發(fā)揮效用。

比如在線教育、景點(diǎn)導(dǎo)游、電商廣告等等場景的音頻制作。

一個有口音的老師,一個普通話不標(biāo)準(zhǔn)的地方導(dǎo)游,以及各種流量奶生。

特別是實(shí)力待豐的流量偶像們,雇傭一個熟練掌握“換臉”和“變聲”技術(shù)的AI團(tuán)隊,就完全能靠臉吃飯,人在家中坐,錢源源不斷來。

總之,只要有音頻的需求,變聲就能降低成本、提高效率。

王小川還想借此應(yīng)用表明,我們正在身處一個怎樣的技術(shù)時代。

跟技術(shù)結(jié)合,人類才能更強(qiáng)大。不要狂妄心懷碾壓排斥,而是接受技術(shù)的變革和改造,成為新人類,真正人與機(jī)器協(xié)同,變得更強(qiáng)大,創(chuàng)造更迷人的未來。

搜狗CEO毫無疑問想推動這樣的未來。

AlphaGo洗禮,搜狗進(jìn)化

在活動上,王小川也再次從AlphaGo講起。

他認(rèn)為這是這個時代的文藝復(fù)興、啟蒙運(yùn)動,讓我們開始換另外的世界觀看待技術(shù)和未來。

對于他自己,這種進(jìn)化更是顯著。

在AlphaGo期間,他就是“機(jī)器必勝”的篤定支持者。而AlphaGo獲勝后,搜狗CEO更是直接為此開辟了一天“狗勝節(jié)”的帶薪假。

很多人都說搜狗會借勢,但少有人了解王小川的遺憾。

因?yàn)樵贏lphaGo宣布挑戰(zhàn)李世石之時,王小川就感嘆過,搜狗內(nèi)部其實(shí)也認(rèn)真討論過深度學(xué)習(xí)下圍棋的可能性和可行性。

但后來不少工程師認(rèn)為需要太多資源、小公司更該務(wù)實(shí)……最終沒有真正展開,直到AlphaGo在Nature上的論文發(fā)表,才慨嘆思路和技術(shù)所見略同。

這讓搜狗CEO學(xué)到一課:光有務(wù)實(shí)主義不夠,工程師也得展現(xiàn)出敢想敢上的“浪漫主義”那一面。

所以“狗勝節(jié)”與其說是慶祝,不如說警醒。

這也是搜狗蛻變和進(jìn)化的開始。

之前搜狗是產(chǎn)品力突出的形象,從瀏覽器、搜索到輸入法,江湖享有名氣,特別是輸入法,在國內(nèi)堪稱“國民應(yīng)用”。

但現(xiàn)在,搜狗的旗幟也越來越多出現(xiàn)在全球AI的“華山論劍”中。

全球CoQA機(jī)器閱讀理解大賽奪冠;

世界MegaFace百萬級人臉識別競賽中奪冠;

WMT2017機(jī)器翻譯頂級評測大賽中英和英中第一;

國際頂級口語機(jī)器翻譯大賽IWSLT決賽第一;

《基于模態(tài)注意力的端到端音視覺語音識別》中標(biāo)國際頂級學(xué)術(shù)會議ICASSP;

此外,還有人工智能應(yīng)用領(lǐng)域的引領(lǐng)性創(chuàng)新。

比如全球首個AI合成主播上崗新華社、CCTV,以及剛剛?cè)〉猛黄频摹扒饲暋弊兟暵涞剌斎敕ā?/p>

還需要提及的是,這只不過王小川和搜狗將自己的技術(shù)底色更鮮明地亮出來而已。

對于技術(shù)、AI的投入,更早之前就能從兩件公益大于其他的“投資”事件中窺見一斑。

清華學(xué)子的年度AI“華山論劍”智能體大賽,創(chuàng)辦21年的搜狗連續(xù)贊助15年,至今都是王小川必會參加的活動。

另一件也跟清華有關(guān)。2016年,搜狗向清華捐資1.8億元用于成立“清華大學(xué)天工智能計算研究院”,集中研究AI等前沿領(lǐng)域技術(shù)。

值得一提的是,最近發(fā)表于全球頂會的端到端音視覺語音識別論文,正是搜狗和清華天工研究院的聯(lián)手之作。

中國AI創(chuàng)新縮影

最后,也是時候借搜狗重新認(rèn)知中國AI的發(fā)展現(xiàn)狀和未來了。

談?wù)撝袊鳤I的時候,恐怕你依然會有這樣的印象:中國應(yīng)用有優(yōu)勢,但基礎(chǔ)研究方面差距太大。

但從搜狗“變聲”突破和應(yīng)用來看,一種越來越明顯的趨勢正在展現(xiàn)。

圖靈獎唯一華人得主、清華姚班創(chuàng)始人姚期智教授更是有準(zhǔn)確概況,在接受《人民日報》采訪時,姚院士這樣說:

中國的人工智能在應(yīng)用上絕對是杰出的,相對來講對于算法基礎(chǔ)研究沒有那么強(qiáng),但是對于這個問題從長期的觀點(diǎn)來看,我還是相當(dāng)樂觀的。

姚期智教授認(rèn)為,AI正在變得熱門,受到越來越多重視,也有越來越人才投身其中,基礎(chǔ)算法和理論研究也都被更集中攻堅。

我覺得我們現(xiàn)在沒那么強(qiáng),但是以后的幾年我們能夠追上。

所以結(jié)合王小川和搜狗的種種努力及其結(jié)果,姚期智教授之言,并非單純樂觀而已。

雖要戒驕戒躁,但也沒必要妄自菲保

如今局勢,我們希望更多創(chuàng)新誕生,既要有信心、也要給耐心,同時也要給予更多關(guān)注,不吝給每一次突破獻(xiàn)上掌聲。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉