人工智能模型如何去思考物理世界
一項新的數(shù)據(jù)集揭示了人工智能在推理方面的糟糕程度,并表明一種新的混合方法可能是最好的解決方法。
問題:名為“CLEVRER”的數(shù)據(jù)集包括2萬個合成視頻短片和超過30萬個基于視頻中事件的問答配對。每個視頻都展示了一個簡單的玩具物體的世界,它們在模擬物理中相互碰撞。在其中一個實驗,一個紅色的橡皮球撞到一個青色的橡膠圓筒上,青色的橡膠圓筒繼續(xù)打在一個金屬圓筒上。
這些問題可以分為四類:描述性的(例如,“與青色圓柱碰撞的物體是什么形狀?”)、解釋性的(“是什么導(dǎo)致了灰色圓柱與立方體的碰撞?”)、預(yù)測性的(“接下來會發(fā)生什么事件?”)和反事實的(“沒有灰色物體,哪個事件不會發(fā)生?”)。這些問題反映了孩子們在探索周圍環(huán)境時很早就學會的許多概念。但后三種需要因果推理才能回答的類別,往往會阻礙深度學習系統(tǒng)。
失敗:由哈佛大學、DeepMind和MIT-IBM沃森人工智能實驗室的研究人員創(chuàng)建的數(shù)據(jù)集旨在幫助評估人工智能系統(tǒng)的推理能力。當研究人員用數(shù)據(jù)集測試了幾種最先進的計算機視覺和自然語言模型時,他們發(fā)現(xiàn)所有這些模型在描述性問題上都做得很好,但在其他問題上卻做得很差。
新舊結(jié)合:該團隊隨后嘗試了一種結(jié)合深度學習和符號邏輯的新人工智能系統(tǒng)。在20世紀80年代末被機器學習取代之前,符號系統(tǒng)曾經(jīng)風靡一時。但這兩種方法都有各自的優(yōu)勢:深度學習在可擴展性和模式識別方面更勝一籌;符號系統(tǒng)更擅長抽象和推理。
這個復(fù)合系統(tǒng)被稱為神經(jīng)符號模型,它利用了這兩方面:一方面使用一個神經(jīng)網(wǎng)絡(luò)來識別物體的顏色、形狀和材料;另一方面使用一個符號系統(tǒng)來理解物體運動的物理性質(zhì)和它們之間的因果關(guān)系。它在所有類型的問題上都優(yōu)于現(xiàn)有的模型。
重要性:作為孩子,我們學會觀察周圍的世界,推斷事情為什么會發(fā)生,并預(yù)測接下來會發(fā)生什么。這些預(yù)測幫助我們做出更好的決定,駕馭我們的環(huán)境,保持安全。在機器中復(fù)制這種因果理解同樣會使它們以更智能的方式與世界互動。