機(jī)器人要瘋,挑戰(zhàn)完記者又來挑戰(zhàn)解說員
如何不再忍受一個你不喜歡的球賽解說員?除了換臺和靜音,現(xiàn)在有了新的方式——用機(jī)器淘汰他。
比起人來說,機(jī)器沒有情感偏向,幾乎不會出現(xiàn)低級錯誤,比如把贊助商sharp當(dāng)作球員名字進(jìn)行介紹,也不會因為把握不好節(jié)奏漏掉關(guān)鍵的比賽細(xì)節(jié),對于歷史數(shù)據(jù)和信息,甚至沒有人能擊敗它,因為它所擁有的是無限的資料庫和迅速搜索分析的能力,而人只能憑借大腦和記憶。
用機(jī)器實時解說比賽,這是人工智能和機(jī)器學(xué)習(xí)的場景性應(yīng)用之一。在這個過程中可以訓(xùn)練機(jī)器對于實時場景信息的處理、分析、解讀和判斷能力。而且如果對于一場高速進(jìn)行的球賽都能實時解說,那這種機(jī)器的模型和能力就還能應(yīng)用到更多場景和情況中。
百度版“人機(jī)大戰(zhàn)”
出于上述考慮,百度度秘研發(fā)團(tuán)隊正在訓(xùn)練旗下人工智能機(jī)器人助理——度秘,解說奧運(yùn)男子籃球賽,而且為了讓這種解說更富挑戰(zhàn)性和交互性,度秘團(tuán)隊請來了擁有多年籃球解說經(jīng)驗的楊毅,他將和度秘同場搭檔解說。這是百度版的“人機(jī)大戰(zhàn)”。
籃球解說員楊毅在解說直播間,他的搭檔將是面前的機(jī)器
不同以往,這次別開生面的人機(jī)解說帶有協(xié)作性質(zhì),但也充滿挑戰(zhàn)意味。機(jī)器和人的差異,可以在賽前、賽中和暫停休息等三個不同場景中被明顯感受到。
在賽前,對于兩隊各自情況和數(shù)據(jù)記錄,度秘表現(xiàn)出了機(jī)器所具備的“博學(xué)性”和準(zhǔn)確性,它準(zhǔn)確調(diào)取了球員信息、歷史對戰(zhàn)數(shù)據(jù)等。而這部分工作以前往往是人類解說員的“功課”,不少解說員需要賽前花費(fèi)大量時間搜索、歸納和整理。
楊毅的解說則只能更加偏向人文性和趣味性,帶有較強(qiáng)的主觀感性。比如介紹立陶宛時,他能夠介紹到立陶宛知名的啦啦隊美女,以及如何在立陶宛叫到一扎啤酒。類似這樣的知識,度秘或許也知道,但它很難主動告訴你,除非在個性化訓(xùn)練和調(diào)校中,它知道你對這些方面的知識感興趣——它會在后臺通過“標(biāo)簽”給用戶描繪畫像。
比賽中,度秘則開始展現(xiàn)實時解說比賽的能力,“誰,什么狀態(tài),在做什么事情,最后結(jié)果如何”,這些比賽基本要素它能夠表述清楚,現(xiàn)場體驗來看,相當(dāng)于在通過收音機(jī)觀看比賽。實際上,圖文版也在同步進(jìn)行中,但完全是機(jī)器自發(fā)的行為,不用再耗費(fèi)任何人力。而此時,楊毅的作用則是帶來圍繞某個狀態(tài)和場景延伸開去的信息,并且豐富解說氛圍。打比方來說,楊毅和度秘在整個比賽過程中相當(dāng)于在進(jìn)行一場相聲表演:楊毅是插科打諢的捧哏,度秘則是不斷圍繞主線進(jìn)行闡述的逗哏。
而在中場休息時間,度秘則帶來總結(jié)分析,比如數(shù)據(jù)統(tǒng)計方面,或者更加個性化的數(shù)據(jù)情況,如某個球員的具體數(shù)據(jù)等。這些數(shù)據(jù)此前依賴于賽會組織方面的統(tǒng)計,只有賽會方面統(tǒng)計完畢才能分發(fā)到解說員,但現(xiàn)在,機(jī)器可以在解說的同時完成這部分工作,并在實時比賽間隙播報。如果你是一位“教練”型的觀眾,那通過機(jī)器帶來的數(shù)據(jù)能夠更加清晰地掌握比賽走勢——此前則有賴于解說員的個人風(fēng)格,畢竟不是每一個解說員都愛在休息時間用數(shù)據(jù)分析比賽。
此外,如果你是一位愛聽段子的球迷,機(jī)器也能從評論中抓取有趣的評論或人氣較高的評論進(jìn)行“解說”。
機(jī)器解說的背后原理
從技術(shù)原理的角度來說,度秘目前可以實現(xiàn)的“解說”能力主要基于自然語言處理技術(shù)(NLP)。簡單來講,這個處理過程和技術(shù)大致可以分為:對需求信息分析理解、獲取基本信息(包括對文字和圖片的信息的搜集、分析和理解)、實現(xiàn)智能化輸出和有風(fēng)格的解說。
其實這個過程也包含了目前人工智能領(lǐng)域的幾大核心技術(shù):語音識別、大數(shù)據(jù)計算和機(jī)器學(xué)習(xí)。
但賽事解說的特殊性在于它比語音識別更加復(fù)雜,也比一般的聊天互動需要更高的智能化程度,因為解說需要基于領(lǐng)域知識,面向不同層次、需求的用戶,理解比賽當(dāng)時的形勢,用自然、流暢、生動的人類語言講解出來。
自動解說主要從機(jī)器翻譯技術(shù)上找到靈感,基于統(tǒng)計和機(jī)器學(xué)習(xí)方法,把基本的統(tǒng)計數(shù)據(jù)翻譯成有趣的人類語言解說。為了實現(xiàn)這種“有趣”和解說風(fēng)格,度秘學(xué)習(xí)了NBA和2012倫敦奧運(yùn)會籃球賽的幾百場比賽文字解說,不僅講人話,還學(xué)到了風(fēng)趣幽默、表情包的運(yùn)用等。
比如在解說某個球員投籃打框未命中時,度秘的表述是:“XXX上籃,咣當(dāng),仿佛聽到打鐵的聲音。”另外,在給大家介紹奧運(yùn)會籃球比賽三分線和NBA 三分線規(guī)制的不同時,它如此說道:“奧運(yùn)會比賽三分線XX米,NBA三分線XX米,不過還有一種三分線叫庫里。”這就是機(jī)器學(xué)習(xí)了人類解說資料的結(jié)果。
為什么是籃球解說?
對于此次選擇從籃球比賽解說入手的原因,新浪科技也詢問了百度大搜索總產(chǎn)品架構(gòu)師景鯤,得到的解答是度秘團(tuán)隊認(rèn)為籃球比賽場景更加豐富、進(jìn)行速度更快、交互更加頻繁,對于機(jī)器學(xué)習(xí)和訓(xùn)練更加有挑戰(zhàn),此外,籃球比賽受眾范圍更廣,在國內(nèi)關(guān)注程度高,可以獲得更多更及時的用戶反饋。當(dāng)然,另外一個隱秘的原因是度秘團(tuán)隊中有不少工程師是籃球愛好者。
度秘此前單獨解說中美籃球賽
不過,除了籃球比賽,機(jī)器解說可能在足球比賽中會更加受到歡迎。因為足球比賽場景要比籃球比賽少,但是涉及的數(shù)據(jù)和知識又會更多。所以在數(shù)據(jù)方面,機(jī)器解說會超越任何解說員的“活字典”般的記憶;其次是對于場面的分析,結(jié)合數(shù)據(jù)會更加有針對性的分析。
實際上,這一定程度上也能幫助球隊教練做決策,比如通過機(jī)器解說掌握的數(shù)據(jù)情況,不斷分析球員狀態(tài)和場面因素,能夠幫助教練實現(xiàn)及時調(diào)整。
其實,將科技運(yùn)用于比賽訓(xùn)練和執(zhí)教并不稀奇,目前世界上最為優(yōu)秀的足球教練之一魔力鳥穆里尼奧就一直通過iPad和應(yīng)用幫助自己分析比賽,及時作出關(guān)鍵決策和判斷。
不過對于度秘團(tuán)隊來說,通過機(jī)器解說球賽的方式訓(xùn)練,目的并不是簡單代替“解說員”,他們希望通過這樣場景化的機(jī)器學(xué)習(xí)訓(xùn)練,未來可以將模型和方法應(yīng)用到更多更廣泛的場景中。“比如北京大雨天氣會造成露面積水,那度秘可以對各方面信息和數(shù)據(jù)做出綜合判斷和分析,引導(dǎo)避開積水路段。”百度多模搜索部總監(jiān)孫雯玉介紹說。
當(dāng)然,度秘團(tuán)隊的“野心”是最終能打造出一款“我的度秘”,它能夠全知全能,給用戶生活、工作提供更多的個性化幫助,更加便利和智能。但目前來講,技術(shù)上尚無法實現(xiàn)這種“全知全能”,對于發(fā)布即將滿一周年的度秘,度秘團(tuán)隊希望在今年內(nèi)推出的2.0版本會有更多場景化和個性化上的豐富。
機(jī)器會讓解說員失業(yè)嗎?
如果把機(jī)器解說放到更寬泛的人工智能進(jìn)展中來看,那也可看做是機(jī)器對于人類活動和能力的一種替代。在讓實時翻譯員、財報編輯和速記等“失業(yè)”后,度秘之類的機(jī)器程序正在讓部分“解說員”下崗。
拿目前人工智能業(yè)界的論調(diào)來說,這些被替代的工作里,很大一部分是“簡單的重復(fù)的腦力勞動”。相比于工業(yè)革命對體力勞動的解放,目前洶涌而來的人工智能革命正是奔著解放部分腦力勞動去的。
機(jī)器在資料收集和分析方面具備優(yōu)勢
不過不必?fù)?dān)心的是,人工智能固然有計算方面的天然優(yōu)勢,但具體到解說這種領(lǐng)域,機(jī)器也肯定不會完全取代人類。比如機(jī)器再如何學(xué)習(xí)、“吃”了多少解說資料,都必然不會在比賽中靈光乍現(xiàn),脫口而出“他繼承了意大利左后衛(wèi)的光榮傳統(tǒng),這一刻他不是說一個人在戰(zhàn)斗,他不是一個人!”之類的激情解說。
這樣的時刻有些類似人機(jī)圍棋大戰(zhàn)里,李世石擊敗AlphaGo的那一局中的“神之一手”。歸根結(jié)底,人類所具有的感性和靈感的那部分,機(jī)器尚不能習(xí)得,也無從學(xué)起。
然而有意思的是,如果完全通過機(jī)器來解說比賽,那解說界再也不用擔(dān)心被批評“不中立”,也不用在比賽中不斷被球迷吐槽了。不知道這是否意味著在解救一部分不堪忍受糟糕解說的球迷的同時,也讓觀看比賽少了吐槽解說的樂趣。
但另一個更有意思的事情是,如果未來某天AlphaGo真的要來中國挑戰(zhàn)柯潔,那這次就可以實現(xiàn)雙重人機(jī)大戰(zhàn)了。一方面是機(jī)器和棋手下棋,另一方面是機(jī)器和人在解說分析上較勁。
當(dāng)然,這時的你也能用機(jī)器助手叫個外賣小龍蝦之類的。