普利乌斯:人工智能在扑克领域的胜利

作者:皮尔2025年07月11日
普利乌斯:人工智能在扑克领域的胜利

普利乌斯,卡内基梅隆大学的扑克机器人,因其创造者之一图奥马斯·桑德霍尔姆而赢得了一项人工智能奖。

桑德霍尔姆获得了人工智能促进协会(AAAI)颁发的2021年罗伯特·S·恩格尔莫尔纪念讲座奖,以表彰他在人工智能领域的研究以及对人工智能社区的服务。

桑德霍尔姆除了是破解多对手游戏复杂性的团队成员之外,他的人工智能目前还在运行美国的肾脏捐赠者库。自2010年以来,大约80%的美国肾脏移植机构一直在使用他的算法来配对捐赠者和受者。

如何像杀手级应用一样思考

机器人的基本工作方式是评估当前情况,然后模拟它可能采取的所有可能动作,然后是所有可能对这些动作的回答,然后是所有可能对这些回答的回答,等等。在对未来进行一定数量的想象动作之后,它会查看决策串,并做出对自己来说结果最好的动作,假设它的对手会为他们采取最好的可能动作。

像桑德霍尔姆这样的人工智能程序员的工作是创建一个算法,有效地模拟所有可能的动作,准确地评估结果(或最终状态)。

机器人拥有的选项越多,它必须运行的模拟就越多。评估指标越清晰,流程就越简单。扑克在这第一个领域中存在巨大的复杂性,而桑德霍尔姆帮助解决了这个问题。

幸运的是,评估结果更容易一些:什么动作能赢得最多或输掉最少的生菜?

发条的滴答声

1996年是国际象棋。加里·卡斯帕罗夫输掉了决定性的比赛给深蓝。

2016年,围棋是下一个。李世石以1比4输掉了比赛。这几乎是一场一边倒的比赛,但在第四场比赛中,阿尔法围棋的搜索功能似乎出了问题。

阿尔法围棋已经开始解决像蛋白质折叠这样的不可解决的问题,将赛场留给年轻的人工智能,并开始解决真正的科学问题。

但它留下了一块未翻动的石头。那就是扑克。扑克可能不如围棋优雅,但这正是它成为人工智能研究下一个圣杯的原因。

围棋由两名玩家进行。两名玩家都知道棋盘的完整状态。另一方面,扑克牌桌上可以有最多十个人。而且玩家在摊牌之前永远无法看到对手的手牌。信息是混乱和不完整的。

正是这种不完整的信息使得人工智能难以处理扑克。棋盘上缺失的每一条信息都会产生一组额外的模拟。软件必须将所有这些模拟运行到最终状态,然后才能决定该做什么。这需要时间。

大小很重要

扑克的另一个复杂因素来自于赌桌游戏。有两个因素决定了可能的下注大小的数量:玩家的有效筹码大小和玩家可以下注的增量。如果可以以一美分的增量下注,那么一个10,000美元的有效筹码就有1,000,000种可能的下注大小。

为了应对这种情况,桑德霍尔姆的普利乌斯简单地使用有限的一组可能的下注大小来运行它的模拟。例如,对于100bb的有效筹码,它可能会运行20个模拟,每个模拟使用5bb增量的下注大小。

这大大减少了所需的计算能力。

这足以让普利乌斯的先驱者利比拉图斯足够好,可以击败最好的玩家的单挑。2019年6月,普利乌斯能够在六人制混乱的世界中做到这一点。

在硅谷,一年是很长的时间。人工智能玩家池中已经出现了一条新的鲨鱼。这一个被称为ReBeL,它从一个较小的起始蓝图中做着普利乌斯所做的一切。它归Facebook所有。

桑德霍尔姆,趁你还能享受你的奖品吧。奇点就要来了。

对在人工智能领域工作感兴趣吗?请看我们的文章:美国人工智能就业趋势。

图片来源:Flickr