《王者榮耀》最難人機“絕悟”問世:打敗人類戰(zhàn)隊
在《王者榮耀》里,排位打不過找人機出出氣,這是很多小伙伴的真實寫照。不過真正有智慧勤訓(xùn)練的人機幾乎是無敵的存在。
在12月22日剛剛結(jié)束的2018KPL秋季賽總決賽上,騰訊AI Lab與王者榮耀及王者榮耀職業(yè)聯(lián)賽共同探索的前沿研究項目—;—;策略協(xié)作型AI“絕悟”首次露面,接受前KPL職業(yè)選手和職業(yè)解說組成的人類戰(zhàn)隊(其中不少段位在王者50星以上,平均水平超過99%玩家)的5V5水平測試,并取得勝利。
在這場比賽中AI戰(zhàn)隊使用了達摩、阿軻、干將莫邪、典韋、張飛對陣人類戰(zhàn)隊的花木蘭、趙云、小喬、項羽、牛魔。
比賽前期,AI戰(zhàn)隊的表現(xiàn)和人類戰(zhàn)隊相比確實缺少了幾分靈動,被打出0-5的劣勢,讓很多觀眾一度產(chǎn)生“人工智能也不過如此的感覺”。但接下來AI戰(zhàn)隊的表現(xiàn)是真的驚艷到了大家。
比如AI達摩在紅buff處的一次漂亮的蹲點,直接用大招跟閃現(xiàn)將趙云秒殺,再比如AI干將莫邪配合AI達摩精準秒殺,同時被敵方項羽牛魔兩人近身竟有條不紊逃生,極其亮眼。
最讓人驚訝的是,AI真的超級會打團,依靠著優(yōu)秀的團隊協(xié)作配合最終一點一點扳回劣勢,逆風(fēng)翻盤贏得了比賽。
據(jù)官方介紹,“絕悟”首先通過監(jiān)督學(xué)習(xí)方法,深度模仿KPL職業(yè)玩家的數(shù)據(jù);其次,會進行大量自我對戰(zhàn),每天的訓(xùn)練強度最高能達到人類150年的訓(xùn)練量。
算法上,模仿人類的決策方法,綜合考慮小地圖信息、己方視野和英雄屬性等多個維度特征,讓它兼具大局觀與微操,決定在游戲的什么時間該去哪里(去上、中、下路或野區(qū)等、單人或配合隊友站位),要做什么(游走殺人Gank、帶兵線、支援或反野),及具體微操怎么做(確定各自站位和角色、組合技能并釋放)。
對戰(zhàn)中,在龐大且有不完備信息的地圖上,10位參與者要在策略規(guī)劃、英雄選擇、技能應(yīng)用、路徑探索及團隊協(xié)作上面臨大量、不間斷、即時的選擇,形成了極為復(fù)雜的局面,預(yù)計有高達10的20000次方種操作可能性。