近日,一個 IBM 機器人參與了一場質疑自身的辯論,論題是“AI 是否會帶來更大的弊端”,最終認為“利大于弊”的觀點險勝。
這場辯論在劍橋聯(lián)合會(Cambridge Union)展開。劍橋聯(lián)合會的辯論禮堂有 150 年的歷史,迎接過撒切爾夫人、羅斯??偨y(tǒng)、霍金、甚至色情演員等等,從總理到總統(tǒng),從明星演員到學界泰斗各行各業(yè)的辯論人士。但怎么也想不到,今天會有 300 名觀眾觀看這場人類與非人類的辯論。
這個機器人是 IBM 的“辯論家計劃”(Project Debater)中的一個對話型 AI 機器人,它是一個兩米高的黑箱子,發(fā)出的聲音類似某個女明星。整場辯論以其發(fā)表的開場詞正式開始。這個機器人設置有一個“群眾演講”(speech by crowd)的應用程序,可以用它分析人們在網(wǎng)上提交的意見來生成自己的論點。它的論據(jù)來自 1100 多份事先提交的人類陳述。
兩個辯論隊分別由一名教授和一名辯論專家組成,兩隊都有這個機器人的 AI 輔助?!拔艺娴暮芎闷?,也很興奮能和一臺機器一起工作?!逼渲幸幻麉⑴c者、反人工智能團隊的辯論專家莎米拉·帕瑪南(Sharmila Parmanand)在活動開始前說。
“人工智能無法在道德上做出正確的決定,因為道德是人類特有的?!眻鱿乱黄澎o。通常觀眾的注意力會在禮堂中位置最高的聯(lián)合會主席身上,但是現(xiàn)在所有人的目光都在這個閃著藍光的辯手身上。
“人工智能的錯誤率低于人類……這將是一個巨大的優(yōu)勢,因為它可以節(jié)省更多時間來執(zhí)行平凡和重復的任務。”它提出了兩個立場相反的觀點。
支持 AI 的一方認為人工智能將在某些領域創(chuàng)造新的就業(yè)機會,并“在工作場合提高效率”。
隨后這個機器人又提出“人工智能可以照顧病人,或者機器人可以教學生——這些領域也不再需要人類。”
人工智能條理清晰地進行了辯論,但也出現(xiàn)了一些失誤。有時它會重復自己的觀點,有時它無法提供詳細的素材來支撐自己的觀點。
這是一場有意思的辯論,但這不僅僅是一場辯論。這次 IBM 展示的技術與之前展示的非常不同。
“辯論家”項目的初始提案脫胎于 2011 年出現(xiàn)的單個 PPT 幻燈片。由于提交內(nèi)容有限,而且挑戰(zhàn)項目的難度比較大,IBM 管理層經(jīng)過了大約一年的仔細考慮,才最終批準了該項目。2012 年,IBM 研究院建立了一個項目團隊,正式啟動“Project Debater”項目開發(fā)。而該項目的實質性工作直到 2014 年才展開。
去年 6 月,IBM 的辯論機器人首次與人進行辯論,最終得分 1:1,觀眾投票認為,Debater 的辯論技巧比人要差,但是信息量很大。當時這個系統(tǒng)有數(shù)以億計的文章庫,可從中提取內(nèi)容,涉及約 100 個主題。當遇到辯論性問題時,需要花費幾分鐘的時間來搜索這些文章,構建論點并進行總體演講。
今年 2 月,在 IBM 的 Think conference 上,AI 機器人再戰(zhàn)冠軍級辯論家 Harish Natarajan。雙方圍繞“政府是否應該資助學前教育”進行激烈交鋒,最終 AI 落敗。
以前這種和人辯論的方式主要是鍛煉 AI 的聽力理解能力和對一個論點做出有意義的回應的能力。這些技能或許是遠遠超過了智能家居或者移動設備中智能助理的能力,但是這些遠遠達不到 IBM 做這個辯論計劃的初衷。
這一次采用 AI 自我辯論的形式,就好像“你把數(shù)千條正面和負面的餐廳評論集中在一起,然后用幾段話總結出來”,IBM 計算機科學家丹?拉哈夫(Dan Lahav)說。
所以這場辯論的意義不在于機器能否說服人類,而是機器可以增強人類。
“人類可以基于我們的文化和傳統(tǒng)更好地理解聽眾,但是機器可以通過大量數(shù)據(jù)來豐富我們的知識,去做一些更加具體的決定,使我們消除作為人類固有的偏見?!盠ahav 說。
機器能找到事物之間各種有效的聯(lián)系,而這些聯(lián)系很有可能因為人的默認想法而被忽略。這會限制我們處理信息的能力。
“2016 年,Debater 還只是一個蹣跚學步的孩子,而到了 2019 年,我們已經(jīng)達到了大學水平,”該項目首席研究員、IBM 杰出工程師諾姆?斯洛尼姆(Noam Slonim)表示,“Project Debater 可以在很多方面幫助人類,可以通過展示一個有爭議話題的兩面,減少人類固有的偏見?!?/p>
長期以來,辯論一直都是一個很具智力挑戰(zhàn)性的任務。讓人類去理解一個論點,并表示支持還是反對,對我們來說是很簡單的,但對機器來說是難以置信的復雜。接下來機器人的挑戰(zhàn)是判斷論證的質量是否足以說服他人。最后,人工智能還必須以一種人類可以理解的敘述方式來闡述論點。
除了辯論,這項技術或許可以運用在任何一個需要收集數(shù)據(jù)并根據(jù)數(shù)據(jù)做出決定的工作中?!澳憧梢园阉醋魇且粋€研究引擎,而不是一個搜索引擎,”Lahav 說,“想象一下,在一場政治演講中,它能提高討論的水平,因為你能了解聽眾在說什么,你會給他們一個參與的平臺。立法者可以更好地看到對方,因為這臺機器可以自我辯論。”
目前來看,這個“辯手”已經(jīng)做得很不錯了,它組織語言的方式,沒有讓觀眾在 11 月這個寒冷的季節(jié)聽著機器的聲音昏昏欲睡。相反,它的存在讓辯論充滿輕松和活躍。
米格姆大學 (University of Birmigham) 法學和倫理學教授、反方的一名成員西爾維·德拉克洛瓦 (Sylvie Delacroix) 走上講臺,并開玩笑地稱 Project Debater 為“黛比”。“人工智能是一種重要的工具,因為它正以絕對的速度改變著我們的工作方式和約會方式?!彼f。
辯論結束后,人們沒有立即投票,而是起立歡呼。之后,觀眾分別走向了代表“贊成”“反對”和“棄權”的三扇門,最終投票結果:48.17% 的人贊成,51.22% 的人反對,0.61% 的人棄權。
“我真的不知道人工智能的未來是什么,”Natarajan 說,“它肯定會產(chǎn)生巨大影響,但我們不知道會是什么?!?/p>