首页 科技正文

AI 可以毁了西洋棋,也可以拯救西洋棋

admin 科技 2020-10-04 11 0

从IBM的深蓝开始,到DeepMind的AlphaZero,电脑陆续征服了西洋棋、围棋等最复杂的棋类游戏最顶尖的棋手。但电脑也在慢慢毁了这些棋类游戏——因为棋手们开始越来越依靠死记硬背电脑的下法来击败对手,让棋类游戏失去了原先的美丽。不过,现在DeepMind团队正在跟前西洋棋世界冠军克拉姆尼克合作,尝试西洋棋的若干变种,试图恢复棋类游戏的美丽。

西洋棋以冷冰冰的逻辑著称,但克拉姆尼克(Vladimir Kramnik)是因为它的美丽而喜欢上这个游戏的。

他说:「这是一种创造。」他对思维艺术在棋盘上的碰撞,复杂而优雅的挑衅和反击的你来我往的爱好,让他在2000年击败了卡斯帕洛夫(Garry Kasparov),坐了好几年的世界冠军王座。

尽管如此,克拉姆尼克去年还是退出了竞技性的西洋棋比赛,同时认为自己心爱的棋类游戏已经变得越来越没有创造力了。他把其中的原因部分归咎于电脑,认为电脑缺少灵魂的算计造就了一个规模庞大的开局和防守库,然后顶尖选手开始死记硬背。克拉姆尼克说:「在最高层级的比赛当中,有相当一部分近半(有时候甚至整场比赛)的下法都是靠记忆走完的。你甚至都没有自己的下法,那全都是电脑的下法。」

在这个研究专案里面,全世界上最会玩西洋棋的电脑跟人一起玩而不是对战上周三,克拉姆尼克就如何让西洋棋恢复一部分人类的艺术提出了一些想法,不过这需要一个有违直觉的来源的帮忙——全世界最强大的西洋棋电脑。他正在跟Alphabet的人工智慧实验室DeepMind合作,让研究人员向他们超人的西洋棋玩家AlphaZero发起挑战,看看后者能不能学习选择出来的九种西洋棋的变体,进而让棋手进入到创新性的新模式。

2017年,AlphaZero 展示了自己可以无师自通,先后在西洋棋、围棋以及日本将棋中击败了最好的电脑棋手。克拉姆尼克说,如果大家愿意对既定规则做出一些小小的改动的话,其最新结果有望展现一幅令人着迷的西洋棋新图景。

该专案还展示了西洋棋棋手与机器之间关系的一种更为合作的模式。从事该专案的DeepMind研究人员Nenad Tomašev 说:「开发西洋棋引擎一开始的目的是要击败跟自己下的人类棋手。现在,我们会看到像AlphaZero 这样的系统被用于跟人类一起进行创造性探索而不是针对他们。」

人类玩西洋棋已有大约1500年的时间,对规则的调整并不是什么新鲜事。对电脑让这个游戏变得无聊的抱怨也不算新鲜。

大约500年前,当欧洲棋手将缓慢移动的棋子提升为如今强大的皇后,让游戏更加流畅之后,西洋棋迅速传播开来。1996年,也就是IBM的深蓝(Deep Blue)击败卡斯帕洛夫的前一年,变成逃亡者的西洋棋神童鲍比·菲舍尔(Bobby Fischer)在布宜诺斯艾利斯召开了一次新闻发布会,在会上他抱怨西洋棋需要重新设计,电脑增强的记忆力应该要给创造力让位。他推出了菲舍尔任意制西洋棋(Fischer Random Chess),这种棋保留了通常的游戏规则,但每场比赛都要把底线那排厉害的棋子的起始位置随机打乱。这种任意制西洋棋又叫做Chess960,后面再西洋棋界慢慢赢得了自己的小众市场,现在还有了自己的锦标赛。

前西洋棋世界冠军克拉姆尼克(左)正在跟Alphabet的DeepMind合作,利用人工智慧探索西洋棋的新形式。右为DeepMind的创始人Demis HassabisDeepMind和克拉姆尼克把AlphaZero无师自通从零开始学习游戏的能力物尽其用,想用借助它来更快地探索西洋棋的新玩法,而不是像过去靠人类折腾了几十年甚至几个世纪才把这种游戏的美丽和缺陷给摸清楚。Tomašev说「你当然不希望自己花了几个月甚至几年才玩会的东西却马上意识到,『噢,不,这种游戏一点都不美。』」

「在最高层级的比赛当中,有相当一部分近半(有时候甚至整场比赛)的下法都是靠记忆走完的。」

——前西洋棋冠军弗拉基米尔 ·克拉姆尼克

AlphaZero 是AlphaGo 更灵活、更强大的升级版,后者曾在2016年击败了当时的围棋世界冠军,为AI历史奠定了一个里程碑时刻。系统开始学习游戏的时候手头只有这3样东西:游戏规则,记分方式以及预先写进程式的不断实验并赢得胜利的冲动。专案的另一位研究人员,DeepMind的Ulrich Paquet 说:「系统刚开始玩的时候表现实在是太糟糕了,我真想躲在桌子底下。但是看着它一步步从一张白纸演变过来的感受令人兴奋,无比纯粹。」

刚开始下西洋棋的时候,AlphaZero 并不知道可以拿下对手的棋子。但经过几个小时高速的对抗之后,其自身的能力开始逐渐增强,跟之前的西洋棋引擎相比,它变得更加熟练,而且在某些人看来表现更加自然。在这个过程当中,它重新发现了几个世纪以来人类玩西洋棋的一些下法,而且还添加了自己的天赋。英国的西洋棋大师马修·桑德勒(Matthew Sadler)表示,研究AlphaZero的下法就像「发现了过去某位伟大棋手的秘密笔记本」。

AlphaZero 测试过的九种西洋棋的替代版包括没有国王入堡版的西洋棋,这种规则克拉姆尼克和其他人已经考虑过,并且在今年一月份举行了第一场专门比赛。这种规则取消了所谓的「国王入堡」走法,这种走法可以让棋手把自己的王躲进由其他棋子组成的防护屏背后——这是一道强大的防御工事,但也会令比赛变得沉闷。其他的五种变体则改变了兵的走法,torpedo西洋棋就是其中之一。在这种西洋棋当中,兵自始至终都可以最多走两格,而不是像原版西洋棋那样只有第一步可以走两格。

解读AlphaZero的结果的办法之一是看冷冰冰的数字。在没有国王入堡的情况下,平局跟一般规则下法相比变少了。而学习不同的规则也让AlphaZero给不同棋子赋予的价值做出了改变:在传统规则下,王/后的价值相当于9.5个兵;而按照torpedo西洋棋的规则,后只值7.1个兵。

「走了三步之后,你就不知道该怎么办了。这种感觉很不错,就像自己是个孩子一样。」

——前西洋棋世界冠军弗拉基米尔· 克拉姆尼克

DeepMind的研究人员最后还是对本专案另外一个西洋棋大脑克拉姆尼克的分析更感兴趣。Tomašev 表示:「这跟数字无关,而是从定性上,在美学上能不能让人乐意坐下来玩的问题。」 上周三发表的一篇技术论文里西包括了克拉姆尼克对AlphaZero的探索做出的70多页的评论。

在AlphaZero 如何适应新规则方面克拉姆尼克看到了一些美丽之处。他说,为了保证国王的安全,没有国王入堡的西洋棋催生了丰富的新模式。self-capture西洋棋是一个更为极端的变化,也就是棋手可以拿掉自己的棋子,结果证明这种改法更加迷人。克拉姆尼克说,这条规则实际上让棋手有更多机会,透过牺牲一颗棋子来取得领先,数世纪以来这种走法被认为是优雅走法的标志。他说:「总而言之,这只会让游戏变得更加美丽。」

克拉姆尼克希望,AlphaZero的这番西洋棋冒险之旅能够说服不同等级的棋手去尝试。他说:「这是我们献给西洋棋界的礼物。」 现在也许是献礼的合适的时机。

曾两次获得美国西洋棋冠军的珍妮佛· 沙德(Jennifer Shahade)说,多年来西洋棋一直很受欢迎,但因为新冠病毒流行很多人为了寻找新的智力刺激又热了起来。大家对Chess960的兴趣也在增长,这表明大家对这种新型的下法产生了浓厚的兴趣,其中就包括部分超级明星。Shahade还会为Chess960锦标赛提供赛事评论,这场锦标赛吸引了包括世界排名第一的马格努斯·卡尔森(Magnus Carlsen) 和前西洋棋世界冠军卡斯帕洛夫在内的一众好手。

就像克拉姆尼克一样,Shahade 认为AlphaZero测试的若干西洋棋变体有值得称道的地方,即便类似允许兵侧向移动之类的走法感觉有点「令人费解」。如果这些新变体当中的哪个能够发展起来的话,一些棋手仍会希望靠电脑和深度研究来取得成功,但是对周期进行重新设置也许会令人着迷。同时也是美国西洋棋联合会女子专案主管的Shahade说: 「新玩法带来的发现会令人耳目一新,结果也许会非常令人兴奋,并令其他类型的棋手受益」。

由于机器无与伦比,DeepMind 和克拉姆尼克的专案还可以鼓励电脑西洋棋变得更具创造力。Eli David是以色列巴伊兰大学的研究员,他自己开发了一个基于机器学习西洋棋引擎。他说:「与其让电脑西洋棋变得更强大,让人类显得相形见拙,不如把西洋棋变成一种游戏艺术」。他的实验室有一名研究生正在研究西洋棋软体,这种软体会学习模仿特定棋手的风格,这样大家就可以求助于机器,问问对方某位深受喜爱的西洋棋大师(过去或者现在的)在特定情况下会怎么走。

克拉姆尼克的经验表明,让人与机器合作而不是对抗,不仅可以丰富这种棋类游戏的技术体验,也可以丰富其情感体验。AlphaZero 甚至把他带到了超出其渊博知识范畴以外的地方。他说:「走了三步之后,你就不知道该怎么办了。这种感觉很不错,就像自己是个孩子一样。」

培养网路世代思辨力,LINE联手均一推出科学媒体素养教材

LINE 与数位学习平台「均一教育平台」,展开为期3年的合作计画,今天公开联手开发的第一波「科学媒体素养教材包」,主题取自时下热议的「为什么疫苗可以抵抗病毒」、「非洲猪瘟」议题。 LINE 台湾董事总经理陈立人表示,LINE 自2019年发起「数位当责计画」,以 LINE 讯息查证平台的 AI 辨识和语意分析技术自动比对可疑讯息,累积至今错假讯息总举报人次已经超过21万人次,举报超过4万则错假讯息,在疫情高峰期,每天更有高达上万人次在线进行讯息举报,一秒破解真伪。 陈立人强调,最重要的是推动媒体素养要从教育向下扎根,因此,LINE 选择在台湾跟均一教育平台深度合作,发展科学媒体素养课程。  ▲ 「科学媒体素养教材包」搭配科普动画、完整的教案、教学简报与学习单,适合国小高年级到国中师生免费线上学习。 均一平台教育

版权声明

本文仅代表作者观点,
不代表本站申博sunbet官网的立场。
本文系作者授权发表,未经许可,不得转载。

评论