人工智能 - GG 德州扑克技术站

历史首次！外媒：人工智能在多人扑克游戏中击败人类

由脸书公司和美国卡内基－梅隆大学共同研发的人工智能系统“Pluribus”在六人制德州扑克比赛中击败了5名职业选手。

外媒称，美国《科学》周刊11日发表的一项研究显示，由脸书公司和美国卡内基－梅隆大学共同研发的人工智能（AI）系统“Pluribus”在六人制德州扑克比赛中击败了5名职业选手。

据埃菲社7月11日报道，这是当前唯一一个在多人比赛中表现胜过人类扑克选手的AI系统。在此之前，在扑克比赛中击败人类是少数AI未能完成的挑战之一。

报道称，对于AI系统而言，扑克具有诸如国际象棋等其他游戏不具备的难点，那就是“信息不对称”：由于桌面上的一些牌始终背面朝上，玩家只能了解游戏进程的一部分。因此，想要获胜就必须理解和猜测其他玩家的行为，这其中包括辨别对手什么时候是在虚张声势以及自己通过虚张声势的做法欺骗对手。

在实验中，该研究报告作者图奥马斯·桑德霍尔姆和诺姆·布朗采用“行动抽象”和“信息抽象”技术，减少AI在一局游戏中需要考虑的行动。

据他们介绍，强化学习系统和新算法的结合是机器能够战胜人类的关键。这款由他们与脸书共同研发的名为“Pluribus”的AI系统，在一次又一次与自身副本的对抗中学会了如何在六人制无限制德州扑克比赛中获胜。

在与副本进行游戏的过程中，该AI系统生成了一套既定策略，科学家们称之为“行动计划”。而在与真实的对手比赛时，Pluribus会通过寻找其他对于应对当局游戏而言更有效的即时行动来改进这套既定策略。

事实上，Pluribus的算法做出的一些反馈甚至让它的开发者感到惊讶。大多数职业扑克选手会避免一种明显不合逻辑的下注方式（在术语中被称作“驴式下注”），其唯一的目的是扰乱在游戏中居主导地位的玩家。然而，Pluribus会相对频繁地使用这种下注方式。被它击败的职业选手之一达伦·伊莱亚斯说：“AI最强的地方在于它运用混合策略的能力。我们人类选手也想做同样的事，但我们在执行上存在问题。以完全随机的方式持续进行这种操作非常难。”

桑德霍尔姆指出，在此之前，在战略思维方面超越人类的AI所取得的重大成就仅限于二人对决，但在如此复杂的游戏中击败5名玩家的能力为利用AI解决现实世界中各种各样的问题提供了新机会。（编译/苏佳维）

人工智能在六人桌德州扑克游戏中击败人类玩家

科技日报北京7月14日电美国科学家开发出一种新的人工智能程序“合众为一”。其在6人无限制德州扑克比赛中击败了6名全球顶尖选手。

科技日报北京7月14日电（记者刘霞）据美国《新闻周刊》网站近日报道，美国科学家开发出一种新的人工智能（AI）程序“合众为一”（Pluribus），其在6人无限制德州扑克比赛中击败了6名全球顶尖选手。研究人员认为，这是人工智能发展史上的一座里程碑，未来有望应用于生物医学、安全等领域。研究发表于12日出版的《科学》杂志。

Pluribus由Facebook人工智能实验室和卡耐基梅隆大学的研究人员携手完成。在游戏中，Pluribus和职业选手共进行了10000手扑克牌比赛。在一种情况下，人工智能面对5名人类选手；在另一种场景中，5个版本的人工智能与一名人类选手对决（AI没有相互配合）。研究人员发现，Pluribus的表现明显优于人类。他们认为，这是“决定性的胜利”。

研究报告共同作者、卡内基梅隆大学计算机科学教授托马斯⋅桑德霍尔姆博士素有“德州扑克AI之父”的美誉，他表示：“在AI领域（至少自1970年以来）和博弈论领域（至少从1950年开始），扑克是测试非完美信息游戏解决能力的主要基准。”

桑德霍尔姆解释说，人工智能已经在国际象棋、跳棋、围棋、双人限制和双人无限制扑克等双人零和游戏中击败了人类。在双人零和游戏中，只能有一方可以获胜，用博弈论的术语来讲，这些人工智能所做的都是在找到一个接近纳什均衡的策略。所谓纳什均衡策略就是指一系列能够使自己预期收益最大化的策略。但由于六人游戏规模大，人数多，上述办法很难扩展到六人游戏。

因此，研究人员需要找到一种方法来摆脱纳什均衡，桑德霍尔姆解释道：“这种策略计算起来要困难得多，但最新算法‘强大且可扩展’，最新胜利‘是AI在多玩家游戏领域的第一个里程碑’。”

桑德霍尔姆表示，这一研究所涉及的战略推理技术未来有望在多个领域“大显身手”，从扑克、视频游戏到投资银行的战略优化、政治运动等，不一而足，其还可以引导进化和生物学适应——例如医疗计划和合成生物学等。此外，该技术还可用于电子战、安全领域等。

总编辑圈点

谷歌的“阿尔法狗”在围棋对弈中大败李世石后，有人指出：别着急，人工智能还没打赢多人德州扑克呢。能在一对一的博弈中获胜，确实是人工智能的重要成就。不过，现实生活中很多竞争场景并非双人对决，而是多人参与，股票投资、职位竞选、招投标活动等等就是如此。因此人工智能在6人德州扑克中获胜，是一座新的里程碑。在此基础上，人工智能有可望为多人竞争的更为复杂的现实场景，提供最优解决方案，从而胜任更多任务。

人工智能冲击下，德州扑克人机混合模式或成新趋势

这些趋势为德州扑克的发展提供了新动能，同时也强化了其作为智力运动的学术研究价值。德信专家指出，人类在情绪管理、心理博弈等层面的独特优势，依旧是人工智能难以完全取代的。

近年来，人工智能在智力运动领域的突破引发广泛关注。继围棋“人机大战”成为热点后，德州扑克逐渐成为AI研究的新前沿。由于德州扑克属于信息不完全博弈，其复杂性远超传统棋类游戏，被认为更能体现人类在不确定条件下的决策智慧。

早在2017年，卡内基梅隆大学研发的AI系统“Libratus”便在与多位职业德州扑克高手的对决中取得压倒性优势。此后，AI在策略优化、概率计算和博弈平衡上的表现日趋成熟。这不仅推动了人工智能技术的应用，也为德州扑克作为智力运动提供了新的研究价值。

在中国，智力运动的发展正逐渐受到政策支持。围棋、国际象棋、桥牌等项目已被纳入重点扶持范畴，而德州扑克尽管在政策尺度上仍面临审慎监管，但其智力博弈属性正在逐步被学界和业界认可。部分高校甚至开始尝试将德扑作为博弈论与人工智能课程中的案例，以探讨复杂系统中的决策机制。

在这一背景下，赛事品牌的角色同样值得关注。作为亚洲专业赛事品牌，德信VIP曾在业内多次讨论AI技术对竞技类项目的影响。德信专家表示，未来，德州扑克的竞技形态或将不再局限于“人人对抗”，而可能发展出“人机混合”甚至“AI 模拟训练”的全新模式。

经济与产业层面，AI的介入有望推动智力运动的商业化。例如，大数据分析能够帮助优化赛程安排与观众体验；AI辅助训练能够帮助选手提升竞技水平。这些趋势为德州扑克的发展提供了新动能，同时也强化了其作为智力运动的学术研究价值。

德信专家指出，人类在情绪管理、心理博弈等层面的独特优势，依旧是人工智能难以完全取代的。随着智力运动在中国社会认知度的提升，未来德州扑克有望以更规范、更学术化的方式被纳入发展体系。包括德信VIP在内的专业赛事品牌在这一进程中的探索，或许将成为推动行业前行的重要注脚。

总体来看，德州扑克在AI与智力运动双重驱动下，正在迎来新的发展阶段。如何在保持竞技价值的同时，借助技术创新实现规范化发展，仍是摆在行业与政策面前的共同课题。