騰訊云在2017騰訊全球合作伙伴大會云計算分論壇上正式宣布智能+視頻能力全面升級,在視頻云的基礎上,為廣大各行各業(yè)用戶提供基于人臉識別、圖像識別、OCR識別、視頻鑒黃、音頻鑒黃、智能客服等人工智能技術與服務,結(jié)合直播、點播、實時音視頻、短視頻、IM等視頻云通信平臺基礎產(chǎn)品并創(chuàng)造出更具行業(yè)特征的產(chǎn)品特性。
▲騰訊云視頻業(yè)務總經(jīng)理李郁濤
“智能+視頻”,1+1=N種智能行業(yè)應用場景
隨著視頻云朝著行業(yè)垂直化、智能化的不斷滲透和發(fā)展,與人工智能相結(jié)合也已成行業(yè)趨勢。目前,在人工智能上占有一席之地的關于語音和圖像的AI技術種類就有很多,比如語音轉(zhuǎn)文字、文本轉(zhuǎn)語音、聲紋識別、證件識別、人臉識別等相關技術,這對于絕大多數(shù)的業(yè)內(nèi)企業(yè)來說,巨大技術門檻是一道不可逾越的鴻溝,只能望“智”興嘆。
不僅如此,要啃下如此繁多且復雜的技術,勢必會投入與之對應的巨大人力和物力,同時也會是一場技術馬拉松,這對于普通企業(yè)來說都是不太利于可持續(xù)發(fā)展的。企業(yè)應當在其自身核心業(yè)務中不斷發(fā)展并建立業(yè)內(nèi)領先優(yōu)勢,現(xiàn)在大多數(shù)企業(yè)正不斷將其自身業(yè)務上云,結(jié)合云的優(yōu)勢來實現(xiàn)業(yè)務的增長和突破已是行業(yè)共識。
作為視頻云行業(yè)的領先者,騰訊云在基于早兩年推出并在業(yè)內(nèi)建立領先地位的視頻云PaaS產(chǎn)品以來,結(jié)合時下騰訊尖端人工智能技術,面向企業(yè)用戶提供一整套“智能+視頻”的全新視頻以及通信平臺能力,旨在為企業(yè)客戶創(chuàng)造更多的智能化應用場景。
在此次的解決方案中,騰訊云將語音和圖像方面的AI能力和視頻云基礎產(chǎn)品做了深度的融合和創(chuàng)新,不僅在原有的PaaS層服務結(jié)合AI技術有了重大升級之外,還提供了豐富的AI元素組件,幫助客戶更好地理解具體的技術能力場景,并加快集成各個產(chǎn)品和服務的所需的開發(fā)周期,應對瞬息萬變的市場,給企業(yè)提供更有力的行業(yè)競爭力。
三大能力升級,音視頻識別準確率99%
騰訊“智能+視頻”能力本次升級發(fā)布主要分為語音+AI、聲紋+AI、視頻+AI三個方面。
首先在語音+AI方面,騰訊云可提供語音文字互轉(zhuǎn)(語音轉(zhuǎn)文字、文字轉(zhuǎn)語音、語義識別)、廣告過濾、違禁檢測、涉政檢測等能力,可以有效過濾國家法律限制的物品信息、涉政敏感信息等,幫助用戶進行敏感詞隔離和輿情監(jiān)控。
其次在聲紋+AI方面,騰訊云在去年推出鑒黃V1.0版后,再一次對升級了鑒黃能力,此次升級是通過音頻內(nèi)容、聲紋識別技術,提供識別準確率超過99%、檢索時間小于150ms的音頻鑒黃V2.0版,通過音頻鑒黃能力能夠廣泛用于版權保護、敏感過濾及游戲角色標注等情況,進一步擴大鑒黃相關業(yè)務范圍。
在視頻+AI方面,騰訊云可在直播、點播等場景中可實現(xiàn)實時字幕和視頻內(nèi)容自動翻譯。根據(jù)相關數(shù)據(jù)顯示,在環(huán)境噪聲50db左右、沒有回音消除的背景下用騰訊云的互動直播音視頻會話時,自動字幕識別準確率高達96%以上,識別的文本均在1S內(nèi)返回并顯示。
基于傳統(tǒng)圖像特征識別與深度學習,騰訊云的手勢識別能力還可應用于直播和短視頻上,動態(tài)手勢識別率接近99%,而移動客戶端CPU僅增長2%。
此外,騰訊云基于綁卡驗證、OCT技術、人臉識別、活體檢驗、騰訊輔助身份信息大數(shù)據(jù)的多維度綜合模型,進一步升級了直播平臺主播的身份實名認證能力,識別通過率已高達95%,誤判率僅為0.01%,為互聯(lián)網(wǎng)網(wǎng)絡凈化又增加一大利器。
實際運用已有成功案例
滿足行業(yè)智能化需求
目前,騰訊云的“智能+視頻”能力已經(jīng)在網(wǎng)絡庭審、小微客服機器人、微信小程序保險定損、視頻檢索等實際運用中有了成功案例。例如解決約80%小型案件的網(wǎng)絡庭審,騰訊云可智能識別語音所屬對象(法官、原告、被告、書記員等),語音文字識別準確率95%以上,達到實時筆錄效果,釋放近90%書記員人力。
在微信小程序保險定損之中,騰訊云可幫助保險企業(yè)快速進行OCR證件識別、視頻定損等,實現(xiàn)音視頻、小程序、AI的融會貫通。此外,騰訊云還讓媒體音像資料的視頻檢索成為可能,囊括市場主流視頻文件格式。
騰訊云視頻業(yè)務總經(jīng)理李郁濤表示,此次升級發(fā)布的“智能+視頻”能力,將騰訊云長久以來的音視頻技術經(jīng)驗和AI能力充分結(jié)合起來,將幫助通信、視頻、社交、游戲、廣電等行業(yè)用戶更加智能化的開展業(yè)務。業(yè)內(nèi)分析認為,騰訊“智能+視頻”能力的升級發(fā)布,也將有助于泛娛樂、在校教育、互聯(lián)網(wǎng)金融、線上法院、智能客服等新生業(yè)態(tài)的快速發(fā)展。