“机器自学72小时堪比国际大师，深度学习到底有多厉害？”-UI科技日报

{/dede:field.body}

【按编辑分类】本文是雷锋网去年9月出的文案，由知社学术圈王鹏编译，原标题《深度学习机器自学国际象棋72小时，差不多是国际大师

谷歌公司创始人宣布谷歌在人工智能行业取得了重要进展。开发了围棋打败职业选手的程序——阿尔法go，《火影》杂志也以封面论文的形式介绍了阿尔法go击败欧洲围棋冠军樊麿，将于3月对战世界冠军李世乐。此前，一位专家曾提到人工智能机器“长颈鹿”。它可以自学像人类一样判断情况下下棋。这完全推翻了以前流传下来的象棋程序。

“机器自学72小时堪比国际大师，深度学习到底有多厉害？”

距离ibm开发的超级计算机深蓝首次在标准锦标赛规则中击败国际象棋世界冠军加里·卡斯帕罗夫已经近20年了。从那以后，计算机将棋选手不断地变得完全强大，所以顶尖的人类棋手即使面对运行着现代将棋程序的高端智能手机，机会也可能很少。

“机器自学72小时堪比国际大师，深度学习到底有多厉害？”

虽然计算机的运行速度越来越快，但是象棋程序的业务模式没有改变。他们的强大总是依靠穷举法，也就是调查未来一切可能性，选择最佳招数的过程。

当然，没有身体能做这种事。即使接近那个也绝对不可能。深蓝以每秒2亿步的速度进行搜索计算期间，卡斯帕罗夫可能最多有每秒5步的思考。但是，他依然能下降到同样的水平。很明显，人类还掌握着不熟悉计算机的奥妙。

问题的关键是判断盘面的状况，减少对最佳棋步的探索。这将大大简化计算业务，修剪表示将棋道路可能性的繁茂大树只剩下几根树枝。

计算机不知道这样的工作，但今天由于帝国理工大学马修·莱的努力，事件发生了变化。

(/S2 ) )赖制造了人工智能机器并将其命名为长颈鹿。它可以自学像人一样判断情况下棋，这完全推翻了以前流传下来的象棋程序。

直接应用的结果是，这台新机器达到了与顶级以前传入的象棋程序相同的水平，这些以前传入的程序经过了多年的优化。与真人对战时，它相当于fide (世界国际象棋联盟)的国际大师水平，位于国际象棋锦标赛选手的前2.2%。

的新机器背后的技术是神经网络系统。这是以人脑为模型的新闻解决模式。包含多个节点，这些节点相互连接，可以通过培训对系统变化提供反馈。在这个培训过程中，我们使用许多实例来微调节点链接，从而允许神经互联网基于特定的输入生成特定的输出。例如，通过照片进行脸部识别。

这几年，神经互联网的迅速发展多亏了两个进步。首先，我们了解了随着神经网络的学习，如何进行微调。这要归功于更高速的计算机。二是大量注释数据集的出现，使人们能够更好地学习神经互联网。

由于这些成果，计算机科学家可以训练被划分为更大层次的神经互联网。这些所谓的深度神经网络的功能变得非常强大，在脸部识别和手写识别等日常模式识别工作中比人类优越。

所以，深度神经互联网能在国际象棋中进行模式挖掘就不足为奇了。这就是莱正在使用的东西。他的网络系统有四个层次，用三种方法共同评价板上的各种状态。

首先，要注意双方棋子的数量和类型、哪个移动、王车易位权等比赛全局；此外，系统将检查各棋子的位置等棋子相关状况，最后描绘各棋子攻防的构图。

莱伊从实际的象棋比赛中仔细选择了那个神经网络系统的训练数据素材。这个数据集需要正确的象棋布局。 “例如，训练系统掌握各自有3位皇后的局面也没有意义。因为这样的安排不会出现在实战中。”

除了高水平国际象棋比赛中常见的局面外，还必须包括多种多样的非平均局面。因为尽管在实际的象棋比赛中实力差不多，但在计算机内部执行的检索中，依然频繁出现。

这个数据集需要相当大的规模。在训练中微调神经互联网内的大量链接只能基于庞大的数据集。使用小数据集，神经互联网将无法识别真实世界千变万化的模式。

赖从电脑国际象棋比赛的数据库中随机选择了500万种盘面状态生成了他的数据集。之后，他在各种状态中随机添加了合理的行走方式，创造了越来越多的变化，最后应用于训练中。这样，他总共生成了1亿7500万种盘面状态。

训练机器的一般方法是人工判断各盘面的状况，将该消息输入计算机，从而能够识别棋局的强弱。

对1亿7500万种盘面来说，这是一个巨大的工作量。这可以通过别的将棋程序实现，但莱对它抱有更大的期待，希望机器能够自主学习。

于是，他利用自举法技术，通过长颈鹿与自己对战来提高对未来局面判断的预测能力。这个办法是可行的。因为每种走法都有相应的参考分数，最终决定其价值。比赛最后赢了，输了，还是平局都没关系。

用这样的方法，计算机掌握它们的形势是有利的，而它们是不利的。

长颈鹿训练后，最后一步要进行测试，但结果很有兴趣。莱伊用一个标准的数据库——战术测试工具包——测试了他的机器。这包括了检测1500种预先设定的局面，象棋程序识别各种战术思路的能力。 “例如，我们有测试对开放线控制理解的设置，也有验证对象和马的价值如何随情况而变化，以及对各自影响的理解的设置。他还说:“也有验证对中心控制的理解的设定。”

测试结果为满分15000分。

赖用这种方法测试了机器的不同学习阶段。自举过程开始时，长颈鹿很快达到了6000分的成绩，72小时后最终上升到9700分。勒展示了这可以与世界上最强的国际象棋项目相媲美。

“真了不起。任何评估功能都是巨大的，包括人类精心设计的数百个参数，在过去几年中一直在人为和自动地进行调整。其中很多都是出自将棋高手之手”他补充道。

赖将继续采用同样的机器学习做法，进一步明确既定的走法是否值得实施的概率。这很重要，因为它不会深入搜索不必要的分支，从而大大提高了计算效率。

莱伊表示，这种概率方法有46%的概率预测最佳打法，有70%的概率将最佳打法放在前三个选项中。所以电脑不需要检测其他走法。

这项爱好的工作标志着国际象棋程序运算方法的巨大变革。当然不完美。长颈鹿的一个缺点是神经互联网比其他类型的数据解决速度慢很多。赖说要探索同样数量的局面，长颈鹿比以前流传下来的象棋程序消耗了多十倍的时间。

“机器自学72小时堪比国际大师，深度学习到底有多厉害？”

但是，即使不足也很有竞争力。赖伊介绍说:“长颈鹿在现代主流电脑上运行后将达到fide国际象棋大师的水平。” 相比之下，顶级象棋程序可以达到超级大师的水平。

这已经很棒了。

“与今天的许多将棋程序不同，长颈鹿的将棋本领不是来源于探索前方的可能性，而是来源于正确判断当前错综复杂的情况，理解许多复杂局面的概念。这些概念对人来说非常直观，但是长时间很难理解象棋的程序。 ”赖说:“这几个在开局和残局阶段很重要，但在这里尤为出色。

“机器自学72小时堪比国际大师，深度学习到底有多厉害？”

这只是个开始。赖表示，这种做法应该直接应用于其他游戏。明显的例子是以前传入了中国围棋，但是现在人类仍然比硅制的对手具有绝对的特征。赖也许能在未来突破。

【作者介绍】知社学术圈、海外学者公益学术交流平台，旨在共享学术新闻、整合学术资源、加强学术交流、促进学术进步。

“机器自学72小时堪比国际大师，深度学习到底有多厉害？”

UI科技日报推荐资讯

patent_patent翻译

行业领军人物杨连军创“中国玉石”平台

王者荣耀S38赛季上分攻略：机制革新与英雄选择全解析,胜率提升秘籍

沈阳越秀·山语湖：202㎡新品三层宅邸，尊享城市山湖间的私密天地

越秀·青铁和樾府 13#峯景王座诚意上新，进阶崂山封面

深圳抵押车贷款雷经理13530875815

深圳车辆抵押贷款雷经理13530875815

拜特科技携手光大银行，助力国企科学城集团司库体系建设

深圳车抵贷雷经理13530875815

“红色江山万里图——香山卷”创作展览在京举行

UI科技日报最新资讯

UI科技日报阅读榜