JSG JMIR严肃游戏 JMIR严肃游戏 2291 - 9279 卡塔尔世界杯8强波胆分析 加拿大多伦多 v8i4e24049 33300493 10.2196/24049 的观点 的观点 人工智能对国际象棋世界的影响 Zary 纳比尔 Bennedik 马丁 Duca伊利埃斯库 迪莉娅莫妮卡 二元同步通信,MSc 1
布拉索夫特兰西瓦尼亚大学 Bdul Eroilor 29 布拉索夫 罗马尼亚 40 268413000 delia.duca@unitbv.ro
https://orcid.org/0000-0001-6767-5561
布拉索夫特兰西瓦尼亚大学 布拉索夫 罗马尼亚 通讯作者:Delia Monica Duca Iliescu delia.duca@unitbv.ro Oct-Dec 2020 10 12 2020 8 4 e24049 1 9 2020 24 9 2020 10 11 2020 ©Delia Monica Duca Iliescu。最初发表于JMIR Serious Games (http://games.www.mybigtv.com), 10.12.2020。 2020

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用最初发表在JMIR Serious Games上的作品。必须包括完整的书目信息,http://games.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。

本文重点介绍了人工智能影响国际象棋世界的关键领域,包括作弊检测方法,这在最近尤其必要,因为在线国际象棋的受欢迎程度出人意料地上升。许多原定于2020年举行的大型国际象棋赛事都被取消了,但由于与其他游戏相比,国际象棋更容易从线下模式转换到在线模式,近几个月来国际象棋在全球的受欢迎程度实际上有所上升。不过,尽管人们可以很容易地在网上下国际象棋,但也有人担心作弊的可能性会增加。人工智能可以解决这些问题。

人工智能 游戏 国际象棋 AlphaZero MuZero 作弊检测 冠状病毒
简介

原定于2020年下半年举行的第44届国际象棋奥林匹克运动会和世界象棋冠军争夺战等重大国际象棋赛事全部取消。然而,许多重大的国内和国际象棋比赛最近都是历史上第一次在网上进行。在2019冠状病毒病大流行期间,国际象棋是少数几个与公众保持密切联系、甚至越来越受欢迎的体育项目之一[ 1,粉丝们可以在家观看在线国际象棋比赛。

尽管在线上下国际象棋的方式与线下几乎相同,但还是有人担心作弊的可能性会增加,许多软件公司正在寻找解决方案。

背景:在国际象棋中展示的人工智能进展

人工智能正在经历一场革命,但与此同时,它也给世界带来了革命性的变化。几十年来,国际象棋一直在推动人工智能的发展。 2].国际象棋人工智能的发展已经超越了游戏,改变了机器和人类共存的方式。战略游戏所突出的人工智能的进步已经影响了许多其他感兴趣的领域,正如近年来已经看到的那样。

最著名的人机大战事件之一是1997年IBM国际象棋软件“深蓝”战胜著名国际象棋冠军加里·卡斯帕罗夫。 3.].然而,这场胜利主要是通过暴力手段取得的,因为深蓝程序每秒搜索了数百万个位置,以略高的强度下棋(该程序以仅1分的差距赢得了与加里·卡斯帕罗夫的6局比赛),所以更令人印象深刻的是,卡斯帕罗夫利用人类的直觉,仍然几乎可以像计算机每秒搜索数百万个位置一样强大。在接下来的几年里,计算能力发展到即使是最好的国际象棋选手也没有机会击败现代国际象棋引擎的地步,正如前面所述[ 4].

仅在20年后,AlphaZero在2017年的一场国际象棋比赛中,仅经过4个小时的自学,就战胜了有史以来最强大的国际象棋引擎之一Stockfish,在人工智能相关领域取得了重大进展。

AlphaZero算法并没有试图使用强大的计算能力来尽可能多地识别棋盘上的走法。相反,使用强化学习,人类的学习过程通过研究大量的国际象棋游戏来模仿[ 5].这种与环境的互动就是人们学习的方式。强化学习,即智能体试图在“复杂、不确定的环境”中最大化奖励[ 6,只是一种交互式学习的计算方法。AlphaZero的创造者声称,该算法可以在任何情况下学习优化决策,而无需更改或指导[ 7,这是一个真正的突破。

此外,一年前还发布了一种甚至超过AlphaZero的算法。2019年11月19日,DeepMind推出了基于强化学习的最新算法MuZero。MuZero算法甚至在最初没有被告知游戏规则的情况下,就学会了比AlphaZero更好地下棋。正如Schrittwieser等人所述,MuZero学习算法在缓冲区中最多保存了100万场象棋比赛,其中3000场比赛是并行进行的[ 8].这是可能的,因为DeepMind可以访问谷歌庞大的云基础设施,并使用了数千个专门为神经网络计算设计的张量处理单元芯片。

由于象棋中可能的位置太多,所以没有办法计算到游戏结束前棋盘上的每一个可能的移动。第一个尝试解决至少5到6个棋子的棋局的桌基是由Ken Thompson [ 9].这样做所需的大量存储使得即使在今天也不可能实现所有可能的国际象棋位置的这一想法。

因此,AlphaZero程序只用了4个小时就学会了国际象棋,这是非常了不起的。然而,在现实世界中,这些规则很少为人所知。因此,新的MuZero算法能够在不接受这些规则的情况下与AlphaZero下棋,这就更加引人注目了。后来,甚至像Leela Chess Zero这样的开源引擎也达到了MuZero的水平,甚至超过了MuZero。这是通过计算机能力和对世界各地大量志愿者提供的源代码的改进而实现的[ 10].

人工智能在国际象棋比赛中的作弊检测

很长一段时间以来,人们一直认为人们会使用人工智能来学习如何更好地下国际象棋,但现在,考虑到他们的比赛历史,人工智能已经成功地用于检测一些选手是否比他们应有的水平下得更好。不过,这些作弊检测机制本身也存在一些争议。

正如国际棋联2014年发布的《反作弊指南》中提到的,在大多数情况下,手持金属探测器足以确保电子设备没有被带入比赛场地,为机载游戏提供作弊保护。然而,对于在线象棋游戏,作弊检测被证明要困难得多。来自55个欧洲联盟的近4000名玩家报名参加了2020年5月举行的欧洲在线国际象棋锦标赛,这是官方国际象棋锦标赛的创纪录人数。欧洲在线锦标赛B组(评分1400-1700)前6名中有5人被取消资格。总共有80多名选手在所有组别中被取消资格,约占选手总数的2%,其中大多数来自初学者或青少年组别。首届欧洲在线国际象棋锦标赛被取消参赛资格,这凸显了在线国际象棋面临的最大挑战:作弊。 11].

最近,包括开发MuZero的DeepMind在内的多家软件公司一直在努力改进现有的作弊检测软件,甚至开发全新的软件,能够几乎100%准确地估计玩家是否作弊。例如,在Chess.com上,一个作弊检测系统使用存储在其数据库中的数百万国际象棋游戏来创建一个统计模型,以评估人类玩家与引擎的顶级选择相匹配,甚至超越历史上一些最伟大的国际象棋玩家的游戏的低概率。所有可能的作弊报告都由一个专家小组仔细分析。调查结果每月都会在网站的“月度回顾”中公布。

在此期间玩的大多数游戏都是快速象棋,而每个玩家玩更长的象棋游戏将会是一个更大的问题,因为将会有更多的时间用于可能被禁止的电子辅助。国际棋联已经批准了一种复杂的作弊检测技术和一种用于国际棋联在线竞技游戏的人工智能行为跟踪模块。这些在线比赛以前被认为与机上比赛是分开的,但在最近的大流行背景下,线下和线上的区别已经缩小,许多正式比赛历史上首次在网上进行。

作弊检测问题

关于在线游戏和欺诈检测,有一些敏感的问题需要考虑。首先,一个不作弊的玩家有可能被归类为作弊者。这显然会给这样一个棋手的职业生涯带来严重的问题。对一个棋手进行这种类型的分析是很困难的,但是在官方在线比赛中玩了几局之后,这些程序可以很容易地识别出正常棋局和使用象棋引擎的棋局之间不太可能的差异。

尝试每次都使用象棋引擎去完美地玩游戏也是不合理的;这也很容易发现,因为玩家排名第一,在这种情况下,游戏可以由人类专家进行评估。因此,对于那些有时依靠自己的决定,有时使用象棋引擎而导致下棋波动的人,基于人工智能的新型作弊检测软件可以很好地检测出这一点,其速度和准确性要比人类裁判高得多。所有可疑的欺诈案件在公布之前都会由该领域的专家小组逐一检查。

该软件使用一种特殊的算法来检测特定棋手不太可能的棋路。为了抓住所谓的作弊者,该软件评估特定棋手的一组棋局(最好至少是几百个,但分析也可以只对少数几局棋局有效),并将其转换为个人表现评级。这有助于使用基于聚类的机器学习算法来确定不合理的移动,结果是一个表明作弊的标志列表。当然,当训练集中某一特定棋手的棋局数较多时,程序的准确率也会较高。

欺骗检测算法必须谨慎地应用于顶级玩家,因为无论何时他们中的一个人做出了一个新奇的举动,它都可能触发欺诈信号。不过,我们可以假设,世界上最好的球员不会为了一场比赛而拿自己的声誉冒险。人们认为练习国际象棋会培养出某些与公平相关的内在品质,这可能就是为什么大多数表演国际象棋选手从不作弊的原因。然而,在线国际象棋越来越受欢迎,特别是在最近几个月,导致越来越多完全不了解国际象棋世界的人试图赢得大型在线比赛,其中一些人试图使用国际象棋引擎来比他们在棋盘上玩得更好。

结论

对于人工智能领域的进步来说,重要的是我们可以衡量机器学习算法的任何突破,例如,通过使用它们的国际象棋引擎。换句话说,可以说国际象棋是人工智能的战场,因为它是测试人类直觉和庞大计算能力之间战斗的完美方式。由于战略游戏的复杂但定义明确,它们已被证明是测试人工智能任何进展的完美环境。

在当今的国际象棋比赛中,与其他在线玩家竞争的比例比以往任何时候都要大,因此,国际象棋玩家和开发作弊检测软件的公司都更加重视在线公平竞争,这也就不足为奇了。

欺骗检测软件早在COVID-19大流行之前就已经用于重要的机载游戏,但这段被迫数字化的时期意味着欺骗检测软件的实施已经大规模进行,即使是娱乐游戏。

我们已经找到了一个关于国际象棋娱乐价值的基本问题:人们真正想看的是什么?是在有时会出错的棋手之间玩的国际象棋游戏(这可能是最有趣和最有教育意义的部分),还是由漂亮但完美得令人痛苦的国际象棋引擎玩的游戏?此外,我们如何评估象棋游戏的娱乐价值或教育力量?分析象棋中的美是什么是很重要的。目前,国际象棋图表中的美感检测算法正在开发中,但这是一个需要在未来的论文中解决的主题。

缩写

国际象棋联合会

没有宣布。

华尔斯坦 D 尽管大流行,国际象棋仍在网上蓬勃发展 《纽约时报》 2020 05 08 2020-09-23 https://www.nytimes.com/2020/05/08/sports/coronavirus-chess-online-tournament.html Risi 年代 从国际象棋和雅达利到星际争霸和超越:游戏AI如何推动AI世界 Kunstl智能 2020 2 18 34 1 7 17 10.1007 / s13218 - 020 - 00647 - w 跳频 深蓝背后:构建计算机击败国际象棋世界冠军 2002 普林斯顿,纽约 普林斯顿大学出版社 穆勒 K Schaeffer J 人机大战:在国际象棋中挑战人类霸权 2018 米尔福德,CT 罗素企业 D 休伯特 T Schrittwieser J Antonoglou Guez 一个 Lanctot Sifre l 库玛 D Graepel T Lillicrap T Simonyan K 哈萨比斯 D 一个通用的强化学习算法,可以通过自我游戏来掌握国际象棋,将棋和围棋 科学 2018 12 06 362 6419 1140 1144 10.1126 / science.aar6404 萨顿 RS Barto AG) 强化学习:简介 1998 剑桥,麻 麻省理工学院出版社 萨德勒 里根 N 游戏规则改变者:AlphaZero突破性的国际象棋策略和人工智能的前景 2019 阿尔克马尔,荷兰 国际象棋新知 Schrittwieser J Antonoglou 休伯特 T Simonyan K Sifre l 施密特 年代 Guez 一个 洛克哈特 E 掌握雅达利,围棋,国际象棋和Shogi计划与学习模式 arXiv 2020-11-30 https://arxiv.org/abs/1911.08265 汤普森 K 某些终局的逆行分析 ICGA J 1986 09 01 9 3. 131 139 10.3233 /协调小组- 1986 - 9302 萨默斯 J 人工智能程序AlphaZero如何掌握它的游戏 纽约客 2018 12 28 2020-11-25 https://www.newyorker.com/science/elements/how-the-artificial-intelligence-program-alphazero-mastered-its-games Schormann C 网上象棋能克服作弊吗? ChessTech 2020 05 24 2020-12-07 https://www.chesstech.org/2020/can-online-chess-overcome-cheating/
Baidu
map