顛覆圍棋后,，培養(yǎng)出“直覺(jué)”的人工智能又攻陷了德州撲克

吳曉曼 2017-1-10 18:04:45

在太平洋這頭的中國(guó),，谷歌旗下DeepMind研發(fā)的阿爾法狗（AlphaGo）剛剛披著“Master”的馬甲戰(zhàn)勝了“當(dāng)今圍棋第一人”柯潔,，宣告著人工智能在圍棋領(lǐng)域的勝出，在太平洋那頭的加拿大,，人類(lèi)在德州撲克領(lǐng)域也要失守了,？來(lái)自加拿大和捷克的10位科學(xué)家近日在預(yù)印本網(wǎng)站arXiv上載了一篇題為《DeepStack：無(wú)限注德?lián)涞膶?zhuān)業(yè)級(jí)人工智能玩家》的論文，介紹了一種能在一對(duì)一無(wú)限注德州撲克中擊敗人類(lèi)玩家的新算法DeepStack,。

在過(guò)去的20年里,，我們見(jiàn)證了許多游戲領(lǐng)域在人工智能面前紛紛“淪陷”，比如西洋雙陸棋,、跳棋,、國(guó)際象棋和圍棋。人工智能在這些領(lǐng)域發(fā)揮的難度,，主要取決于這些游戲需要作出的決策點(diǎn)（decision points）數(shù)量,。一盤(pán)圍棋游戲約包含有10的170次方個(gè)決策點(diǎn)。

但是,，圍棋等棋類(lèi)游戲是完美信息游戲,，也就是說(shuō)，所有玩家在游戲中能獲得的確定性信息是對(duì)稱(chēng)的,。但除此之外，人類(lèi)生活中還要面臨更多非完美信息的情景,，正如計(jì)算機(jī)之父馮·諾依曼所說(shuō),，“現(xiàn)實(shí)世界與此不同，現(xiàn)實(shí)世界包含有很多賭注,、一些欺騙的戰(zhàn)術(shù),，還涉及你會(huì)思考別人會(huì)認(rèn)為你將做什么?！?/p>

德州撲克就是這樣一種包含了欺騙,、推測(cè)的非完美信息游戲，玩家只能掌握自己手上的牌,，通過(guò)這種非對(duì)稱(chēng)的信息與對(duì)手進(jìn)行博弈,。

因此,，雖然一對(duì)一無(wú)限注德?lián)溆螒蛑邪?0的160次方個(gè)決策點(diǎn)，要少于圍棋,，但它對(duì)人工智能的推理能力提出了更高的要求,。

在過(guò)去，研究人員往往采用一種壓縮型的策略來(lái)開(kāi)發(fā)算法,，即通過(guò)把原始版本游戲中的設(shè)計(jì)和行為轉(zhuǎn)移到一個(gè)被壓縮了的情境下推理,。但在壓縮的過(guò)程中，信息會(huì)出現(xiàn)丟失,，造成此前人工智能從未在撲克領(lǐng)域擊敗人類(lèi)玩家,。

而這個(gè)加拿大和捷克的合作團(tuán)隊(duì)開(kāi)發(fā)的新算法DeepStack，則注重培養(yǎng)人工智能出牌時(shí)的“直覺(jué)”,。在運(yùn)用深度學(xué)習(xí),，反復(fù)自我博弈之后，DeepStack學(xué)會(huì)了在每一個(gè)具體情境出現(xiàn)時(shí)進(jìn)行推理,。這非常接近人類(lèi)玩家的“牌感”,，即在當(dāng)前情境下對(duì)個(gè)人牌面大小的感覺(jué)，并作出相應(yīng)的決策,。

該團(tuán)隊(duì)邀請(qǐng)了來(lái)自17個(gè)國(guó)家的33名專(zhuān)業(yè)撲克選手挑戰(zhàn)DeepStack,，在2016年11月7日到12月12日之間共進(jìn)行了44852次較量。DeepStack成為了首個(gè)在一對(duì)一無(wú)限注德?lián)渲袘?zhàn)勝人類(lèi)玩家的人工智能,，并且平均勝率達(dá)到了492mbb/g（milli-big-blinds per game,，一般職業(yè)玩家認(rèn)為50mbb/g是個(gè)門(mén)檻）。

（原標(biāo)題：顛覆圍棋后,，培養(yǎng)出“直覺(jué)”的人工智能又攻陷了德州撲克）

來(lái)源：吳曉曼

相關(guān)閱讀

荒唐,！韓國(guó)視力障礙選手亞殘奧會(huì)奪金：被曝視力1.0 還考駕照

體育環(huán)球時(shí)報(bào) 2018-10-12 16:27:08

歐洲國(guó)家聯(lián)賽：葡萄牙3:2力克波蘭 C羅繼續(xù)缺陣

體育中國(guó)新聞網(wǎng) 2018-10-12 11:08:03

熱身-姆巴佩替補(bǔ)破門(mén)+造烏龍法國(guó)終場(chǎng)前追2球2-2

體育新浪體育 2018-10-12 10:08:32

海南公開(kāi)賽暨歐巡挑戰(zhàn)賽首輪佛瑞斯特三頭老鷹62桿破紀(jì)錄領(lǐng)先

體育椰網(wǎng) 2018-10-12 9:50:27

中國(guó)女排3-1勝俄羅斯第二階段四戰(zhàn)全勝晉級(jí)六強(qiáng)！