大公网

大公报电子版
首页 > 新闻 > 国际 > 正文

多人得州扑克赛 美AI击败顶级玩家

2019-07-13 03:03:32大公报
字号
放大
标准
分享

  图:合作研发Pluribus的图奥马斯.桑德霍尔姆(左)和诺亚姆.布朗\网络图片

  【大公报讯】综合法新社、英国广播公司及新华社报道:美国卡内基梅隆大学11日宣布,该校研究人员和科技公司Facebook人员合作开发的人工智能(AI)程式在一场六人得州扑克比赛中,击败多名世界顶尖选手,成为AI在多人比赛中战胜人类的里程碑。AI此前已成功在西洋跳棋、国际象棋、围棋和双人扑克比赛中击败人类,如今在多人扑克比赛中,AI又赢了。

  这一AI程式名叫“Pluribus”,由卡内基梅隆大学计算机科学教授图奥马斯.桑德霍尔姆和Fb人工智能部门的诺亚姆.布朗合作研发。在一次六人无限注得州扑克比赛中,Pluribus击败了一群顶级职业玩家。该成果11日发表在美国《科学》期刊上。

  通过万亿次自我对战学习

  Pluribus首先在两场比赛中,分别击败了两名扑克牌冠军达伦.埃利亚斯和克里斯.弗格森,两人在对战Pluribus的比赛中各自出了5000手牌。随后,Pluribus又和13名得州扑克高手进行了总数为1万手牌的不限注六人对战,每次比赛中由AI对战5名人类选手,结果AI取得胜利。

  在多人遊戏中,AI必须不断争取先手才能最终获胜。研究人员为此设计了一种新的“有限前瞻搜索”算法,让AI能做出平衡的整体决策。在研究人员开发的模型中,AI会通过数万亿次的自我对战,一点一点学习如何利用出牌顺序获得优势。

  布朗表示,Pluribus的一个优点是训练所需成本相对较低,仅需要价值150美元的云计算资源支撑。此外,Pluribus仅通过20小时的学习,就可以拥有击败世界顶级扑克手的能力。平均来说,这个AI程式在和5个人对战时,每小时可赢得1000美元。

  会运用综合策略

  令人惊讶的是,Pluribus在比赛中会让自己变得难以预测。例如,它比高级玩家使用“领先下注”(donk bet)的次数更多,因为传统上这种方式被认为不佔优势。一般来说,上一轮的跟注者会过牌给上一轮的加注者,好让对方连续下注。如果跟注者没有过牌,而是率先下注,则称为“领先下注”。

  被AI击败的埃利亚斯说:“它(Pluribus)的主要优势是运用综合策略的能力。这和人类尝试做的事情一样,关乎执行力─以完美的随机方式和一贯性出牌,而大多数人都无法做到。”

  研究人员指,与国际象棋和围棋比赛相比,得州扑克的挑战更大,比赛中每方都不知道对手的牌,对手还可能在押注时虚张声势,因此决策只能基於不完全信息,这与真实世界中的问题更接近。

  桑德霍尔姆表示,Pluribus的成就“堪称是人工智能和博弈论的里程碑”。他说,今次胜利将为AI解决真实世界问题提供新的可能性。

点击排行