當(dāng)前位置：首頁 > 充電吧 > 充電吧

下棋下不過AI，打撲克也不行

時間：2017-03-07 17:10:35

關(guān)鍵字： AI 新鮮事下棋打撲克

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]近日，兩個人工智能程序成功證明了自己，機(jī)器也可以懂得什么時候跟牌什么時候棄牌。它們首次在十分普及的紙牌游戲——德州撲克——中戰(zhàn)勝了人類的專業(yè)玩家。

近日，兩個人工智能程序成功證明了自己，機(jī)器也可以懂得什么時候跟牌什么時候棄牌。它們首次在十分普及的紙牌游戲——德州撲克——中戰(zhàn)勝了人類的專業(yè)玩家。本周，其中一個AI的幕后團(tuán)隊(duì)，深度堆棧(DeepStack)，向我們透露一些成功背后的秘密——這可能是AI從航空安全系統(tǒng)走向商務(wù)談判的沖鋒號。

各種博弈游戲中AI的統(tǒng)治地位由來已久，比如象棋，比如去年讓人類僥幸贏了一盤的阿爾法狗，但在撲克領(lǐng)域AI一直表現(xiàn)的挺糟糕。深度堆棧的研究人員將新的算法和深度機(jī)器學(xué)習(xí)結(jié)合起來，終于打破了他們連敗的局面。深度學(xué)習(xí)是計算機(jī)科學(xué)中一種模仿人類大腦的方法，使得機(jī)器可以自學(xué)。

"這是一種尺度可調(diào)的處理復(fù)雜信息的方法，可以在短時間內(nèi)做出優(yōu)化的決定，甚至比人類還好。"Murray Campbell說道，他是紐約IBM公司的研究員，曾經(jīng)最好的象棋AI，深藍(lán)，的創(chuàng)造人之一。

象棋和圍棋有一個重要的共同點(diǎn)，也是AI的首要優(yōu)勢：他們都是完美信息博弈。這意味著雙方都完全了解對方在做什么——這在設(shè)計AI時有巨大的幫助。德州撲克中的跟牌卻不相同，此時玩家要面對兩張具有隨機(jī)性的未知底牌。每輪公共牌后玩家要做出適當(dāng)?shù)男袆?，押注、跟注或棄牌。因?yàn)橛螒蚓捅旧淼牟淮_定性以及初始底牌未知，不像象棋，可以從當(dāng)前盤面以及對手所有可能的步驟中推算最優(yōu)策略。玩德州撲克需要某種我們稱之為直覺的東西。

傳統(tǒng)博弈類AI原理可簡述為盡可能深地計算所有可能的步驟并利用算法將過去已有的對戰(zhàn)數(shù)據(jù)排序分析。缺點(diǎn)在于，為了壓縮可用數(shù)據(jù)，有時會把一些無效策略組合起來，加拿大Alberta大學(xué)的計算機(jī)教授Michael Bowling說到。

他們團(tuán)隊(duì)的AI規(guī)避了只計算前幾步而不去計算全局即輕易判斷的方法。程序在獲得新的信息之后會不斷調(diào)整算法。當(dāng)AI需要比對手先行動，而此時沒有新的信息來做判斷，深度學(xué)習(xí)就發(fā)揮作用了。

神經(jīng)網(wǎng)絡(luò)，是一種把深度學(xué)習(xí)獲取的知識加以歸納的系統(tǒng)。通過訓(xùn)練其在博弈中的行為可以幫助限定算法需要考慮的潛在情況。這使得AI的反應(yīng)可以更為迅速而準(zhǔn)確，Bowling說到。為了訓(xùn)練深度堆棧的神經(jīng)網(wǎng)絡(luò)，研究人員讓其解了超過一千萬局隨機(jī)生成的牌局。

去年研究人員為測試深度堆棧，安排它與國際撲克聯(lián)合會選出的33名專業(yè)撲克玩家對戰(zhàn)。在4周的時間里，程序共演算了44852局一對一無限注德州撲克，這是一種雙玩家無下注上限的版本。通過公式估算其中非策略、偶然獲勝的比例后，最終深度堆棧的勝率為486mbb每局，1mbb定義是每局獲勝需要押注的千分之一。這是專業(yè)選手一般認(rèn)為很大的利潤率的10倍，該團(tuán)隊(duì)的結(jié)果已在science上報道。

這項(xiàng)結(jié)果呼應(yīng)了幾周前大獲成功的Libratus，一款由Carnegie Mellon 大學(xué)設(shè)計的撲克AI。經(jīng)過長達(dá)20天，共約120000手牌的激戰(zhàn)，AI戰(zhàn)勝了4位人類頂尖的德州撲克玩家。兩個團(tuán)隊(duì)都聲稱其AI在德州撲克的優(yōu)勢已經(jīng)在統(tǒng)計上確認(rèn)了。不同之處在于Libratus缺少深度學(xué)習(xí)的過程而需要更多的計算資源，它的算法每次都對游戲進(jìn)行完整的運(yùn)算。而深度堆棧在筆記本電腦上就可以跑，Bowling說。

雖然目前還不知道這兩個AI誰是德州撲克王中王——暫時也沒有安排兩個對戰(zhàn)的計劃——雙方團(tuán)隊(duì)都在把系統(tǒng)加以改造以適用于更加復(fù)雜的實(shí)際問題中，像是安保和談判。Bowling正試圖將其應(yīng)用在公共運(yùn)輸信譽(yù)系統(tǒng)中優(yōu)化查票機(jī)制。

研究者還很關(guān)注該技術(shù)在商業(yè)上的影響。由于其可以在非完美信息下作決斷，可以幫助房子的買家在知道所有競價前預(yù)測競標(biāo)價格，制定抵押計劃。其它的完美信息系統(tǒng)，例如阿爾法狗就沒辦法做到這一點(diǎn)，因?yàn)槿狈ζ渌倶?biāo)數(shù)量和大小等的限制條件。

當(dāng)然，距離深度堆棧能夠完全模仿復(fù)雜的人類決策還有很多年，Bowling說。機(jī)器還要學(xué)會在不知道游戲規(guī)則的情況下如何做決策，好比如果AI沒有提前進(jìn)行神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)。

Campbell同意這一點(diǎn)，打撲克是比下棋復(fù)雜不少了，但要能處理一團(tuán)亂麻的現(xiàn)實(shí)世界還要繼續(xù)努力。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點(diǎn)：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運(yùn)營商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]