www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]百度硅谷實驗室(SVAIL)周一上線了網(wǎng)頁應(yīng)用 SwiftScribe,基本的功能是把音頻資料轉(zhuǎn)錄成文字。在一篇博客文章中,項目主管 Tian Wu 說他們解決了一個重要的“痛點”:消耗大量時間的逐字聽寫轉(zhuǎn)錄。

百度用人工智能技術(shù)做了新產(chǎn)品。

百度硅谷實驗室(SVAIL)周一上線了網(wǎng)頁應(yīng)用 SwiftScribe,基本的功能是把音頻資料轉(zhuǎn)錄成文字。在一篇博客文章中,項目主管 Tian Wu 說他們解決了一個重要的“痛點”:消耗大量時間的逐字聽寫轉(zhuǎn)錄。

SwiftScribe 目前還處在內(nèi)測階段,并未開放,不過你可以通過一個演示示例了解它是怎么工作的。SwiftScribe 支持上傳時長 1 個小時以內(nèi)的 wav 或 mp3 文件,目前只接受英文。接下來它需要花點時間生成文字,官方說法是,1 分鐘的錄音需要不到 30 秒、1 小時的錄音需要 20 分鐘左右。

接下來你會在網(wǎng)頁上看到轉(zhuǎn)錄好的文字,但這并不意味著轉(zhuǎn)錄結(jié)束。文本不會區(qū)分大小寫、沒有標點符號,更沒有分段,你需要在文本框中手動編輯,然后再做導(dǎo)出。這個過程也會被百度記錄,就像所有的人工智能學(xué)習過程一樣,它用來幫助算法糾正錯誤,提高準確率。

文本框底部有一排工具欄,播放按鈕開啟,一個高亮的標識會跟隨語音標出閱讀的進度,方便你停下來查看這個單詞對應(yīng)的語音。這個工具欄還有變速、標記的功能。

這個過程就相當于用機器算法取代了速記員、聽寫員的工作。“SwiftScribe 會在廣泛的領(lǐng)域內(nèi)帶來積極影響,提高生產(chǎn)力,包括醫(yī)療機構(gòu)、法律、商業(yè)和媒體。”Tian Wu 在博客中說,專業(yè)領(lǐng)域的人工聽寫效率低,1 小時的錄音往往需要花費 4-6 個小時,每分鐘語音的成本在 1 美元,SwiftScribe 能把完成工作的時間平均縮短 40%。

Tian Wu 在接受采訪時表示,他們以后還會增加對視頻文件的語音識別支持,也會添加自動插入標點符號等功能。

語音識別并不是什么新鮮事物,你手機里的各種語音助理比如 Siri、 Cortana 都基于此,用戶關(guān)心的唯一問題可能是到底識別的準確性有多高。

按照 Tian Wu 的介紹,SwiftScribe 基于他們的最新研究成果 Deep Speech 2。2014 年百度的首席科學(xué)家吳恩達剛剛?cè)肼毎俣炔痪?,就帶著一個 10 人的團隊開發(fā) Deep Speech,一套語音識別系統(tǒng)。

當時的研究重點在怎么提高嘈雜環(huán)境下的英語語音識別準確率。百度收集了 9600 個人 7000 小時的語音樣本,添加了 15 種噪聲,把樣本擴充到 10 萬小時。吳恩達說這套系統(tǒng)的錯誤率比同期的微軟 Bing Speech、Google Speech API 等競爭對手低 10%。

2015 年,硅谷人工智能實驗室又發(fā)表論文公布了 Deep Speech 2 ,這個系統(tǒng)開始學(xué)習漢語,也提高了對不同英語口音識別的能力。

到 2016 年,百度利用 Deep Speech 技術(shù)推出基于 Android 的語音輸入應(yīng)用 TalkType,強調(diào)輸入法對“語音優(yōu)先”。同一年,Deep Speech 2 還入選了《MIT 評論》評出的“ 2016 年十大突破技術(shù)”,入選的理由是“語音識別技術(shù)讓智能手機變得更易操作”。

可以確定的是,百度之后還會花費更多的精力、更多的錢來支持人工智能的研究,這是李彥宏反復(fù)提及的最新故事。

上個月的財報電話會議上,李彥宏說會壓縮百度糯米和百度外賣的補貼和營銷費用、公司的未來在人工智能領(lǐng)域:“人工智能是改變互聯(lián)網(wǎng)和傳統(tǒng)工業(yè)的一個巨大機會。”

與之對應(yīng)的是,百度 2016 年的營收漲了 6.3%、凈利潤少了三分之二。這是百度自成立以來,年度凈利潤首次下跌。而百度總收入中,依然有九成以上來自廣告業(yè)務(wù)。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉