AI 模型 GameGAN 重寫《吃豆人》,目標(biāo):看視頻就能學(xué)習(xí)的 AI
英偉達(dá)稱稍后會(huì)放出一個(gè)使用 AI 模型 GameGAN 復(fù)刻的游戲,以致敬誕生40周年的街機(jī)版。
根據(jù)英偉達(dá)發(fā)布的研究報(bào)告,GameGAN 目標(biāo)是用神經(jīng)網(wǎng)絡(luò)取代游戲引擎。
它不同于以往用 AI 做游戲的例子。之前的谷歌 DeepMind 和 Open AI 還是在現(xiàn)有游戲框架中,被用來“玩游戲”,相當(dāng)于是智能生成一個(gè)游戲?qū)κ?。比?OpenAI 被用來在 Dota2 5v5中對(duì)戰(zhàn)人類,OpenAI 2018年通過學(xué)習(xí)人類演示,在蒙特祖瑪?shù)膹?fù)仇游戲中刷出了74500分的高分。
GameGAN 則被用來“創(chuàng)作”游戲,是對(duì)現(xiàn)有游戲代碼的取代。它在訓(xùn)練過程中攝入大量游戲劇本和鍵盤動(dòng)作,通過觀察場(chǎng)景和玩家的操作動(dòng)作,預(yù)測(cè)下一幀游戲畫面,而不訪問底層游戲邏輯或引擎。
“當(dāng)玩家按下左鍵的時(shí)候,這個(gè) AI 會(huì)猜測(cè)畫面的變化,并且生成一個(gè)“看起來是角色在往左走”的圖像。 中間發(fā)生的事情,全部都在 AI 的黑盒中。 沒人知道 AI 是怎么理解玩家操作的,得到的只有最終的輸出結(jié)果?!?/p>
除了生成下一幀游戲畫面,GameGAN 還學(xué)習(xí)環(huán)境的內(nèi)在動(dòng)力學(xué),“我們有興趣訓(xùn)練一個(gè)游戲模擬器,它可以模擬環(huán)境的確定性和隨機(jī)性”。
GameGAN包括動(dòng)力引擎;記憶模塊;渲染引擎;對(duì)抗性損失、循環(huán)損失訓(xùn)練和培訓(xùn)計(jì)劃。
首先GameGAN要學(xué)習(xí)環(huán)境會(huì)如何跟隨用戶操作變化而改變,這涉及一些基本的規(guī)則,比如不能穿過墻壁。同時(shí)還要通過訪問歷史,產(chǎn)生一致性模擬。場(chǎng)景中的長(zhǎng)期一致性實(shí)現(xiàn)通過記憶模塊實(shí)現(xiàn),GameGAN使用內(nèi)存模塊,記住生成的靜態(tài)元素,如背景,并在需要的時(shí)候適當(dāng)檢索。神經(jīng)渲染引擎負(fù)責(zé)渲染模擬圖像。此外,對(duì)抗訓(xùn)練用來完成圖像和視頻的合成任務(wù),GameGAN用對(duì)抗性訓(xùn)練學(xué)習(xí)環(huán)境動(dòng)力學(xué),并產(chǎn)生真實(shí)的時(shí)間相關(guān)模擬。
這次復(fù)刻,主要訓(xùn)練的細(xì)節(jié)包括吃豆人的速度和移動(dòng)能力;鬼魂的運(yùn)作方式;吃豆人吃下大力丸后的變化;鬼魂與吃豆人相遇的場(chǎng)景。據(jù)了解,GameGAN基于PyTorch開發(fā),模型研發(fā)已經(jīng)進(jìn)行了8個(gè)月,關(guān)于復(fù)刻只用了4天。
游戲開發(fā)商萬代南宮夢(mèng)為此次訓(xùn)練提供了總計(jì)幾百萬幀、50000集的劇本。該公司的 Koichiro Tsutsumi 表示:“在看到這個(gè)結(jié)果時(shí),我們都感到震驚,大家都無法相信可以在沒有游戲引擎的情況下再現(xiàn)了南夢(mèng)宮的經(jīng)典游戲。這項(xiàng)研究將幫助游戲開發(fā)人員加快新關(guān)卡、角色甚至游戲的開發(fā)。一想到這一點(diǎn),我們就感到十分興奮?!?/p>
不過,復(fù)刻游戲只是開始,英偉達(dá)的目標(biāo)是擴(kuò)展模型來捕捉更復(fù)雜的現(xiàn)實(shí)世界環(huán)境。英偉達(dá)多倫多研究實(shí)驗(yàn)室主任 Sanja Fidler 表示:“我們最終將訓(xùn)練出一個(gè) AI,其只需通過觀看視頻和觀察目標(biāo)在環(huán)境中所采取的行動(dòng),就能模仿駕駛規(guī)則或物理定律。” 而 GameGAN 只是第一步。