本篇文章3706字,读完约9分钟

【编辑】毕业于作者北大软件与微电子研究院研究生院,围棋业余5段,现参与在线围棋教育开发项目。

“珍珠港被空袭击了! 这不是演习! 这不是演习! 这不是演习! ”

――年1月28日凌晨

从昨晚开始,一位ai在19号板上先于樊黑二段获胜,声称论文刊登在nature上的新闻炸毁了微信的力矩。 一开始,像以往任何“大信息”一样,大家都认为是标准问题党。 甚至某个业余7段也被确认为该论文没有通过nature的审查原稿。

“谷歌AlphaGo的胜利:不是计算机打败了人类,而是人类打败了人类”

但是随着时间的推移,收到了更多近距离的详细信息,开始有人相信信息的真实性。 围棋界各种微信群、微信群的朋友圈不断争论,相信的人很多,不相信的人也多次发表意见。

终于,将近凌晨两点,又来了一个最新的报道。 这次也有棋谱。 “面对谷歌围棋ai,人类最后的智力骄傲快要崩溃了……”(虽然是真实消息,但有点标榜党的嫌疑) )到目前为止,所有看过棋谱的人几乎都相信了。 ( )人工智能alphago实现了里程碑式的一步。

“谷歌AlphaGo的胜利:不是计算机打败了人类,而是人类打败了人类”

从昨晚开始,一位ai在19号板上率先战胜粉丝麾麿二段,同时,一则声称论文刊登在nature上的新闻炸毁了微信的力矩。 一开始,像以往任何“大信息”一样,大家都认为是标准问题党。 甚至某个业余7段也被确认为该论文没有通过nature的审查原稿。

“谷歌AlphaGo的胜利:不是计算机打败了人类,而是人类打败了人类”

但是随着时间的推移,收到了更多近距离的详细信息,开始有人相信信息的真实性。

围棋界各种微信群、微信群的朋友圈不断争论,相信的人很多,不相信的人也多次发表意见。

终于,将近凌晨两点,又来了一个最新的报道。 这次也有棋谱。 过去最强的围棋ai大致是crazystone、zen、银星围棋几个。

另一方面,阿尔法go在把这些项目(无银星围棋)定为4人时,取得了80%左右的胜率。 据此,人工智能可以评价为一下子提高了自己的水平上限5个。

樊二段作为欧洲冠军而闻名,但谁都知道他实际上是中国旅欧教育的职业棋手。

虽然远离东亚职业第一线,但樊老师的水平仍然不容置疑。 他依然有职业水平,常规行业6依然不如他。

据说阿尔法go在正式比赛中向樊老师确认了棋谱为5:0 ( ),非正式比赛的总分为8:2 ) )。 再加上阿尔法go在棋谱中展现出的惊人表现,被认为围棋中的人工智能水平已经进入职业大门。

()/S2/)最新:根据众多顶级棋手对棋谱的鉴定,普遍认为alpha go的水平应该在业余6段强到弱职业之间,与人类顶尖大致有一双的差距(/S2/) (/S2/)

更简单地说,此前的ai得益于蒙特卡罗算法取得了革命性的进步,战胜了绝大多数人类,但人类中能够战胜任何一个ai的人数可能仍然处于近百万人的水平。

从今天(其实已经是三个月前)的alpha go开始,在围棋棋盘上能够战胜ai的人数可能不到一千人。

facebook人工智能研究院的田渊栋老师说,这个消息在相关研究圈内应该早就不是信息了。

即使想起昨天扎克伯格在facebook上突然放声声援自己的研究小组,他也想抢占舆论的位置,因为他知道谷歌小组的成果马上就要在一天内公示了。

(田老师参加的facebook研究小组是谷歌目前最大的同行竞争对手。 山田老师们采用的做法应该不同。 虽然他们暂时落后,但我也同样期待着他们的下一步进展)。

总之,从事实来看,这不是演习已经是明显的事实。

接下来谈谈个人对人工智能的粗浅理解。

近年来,在蒙特卡罗算法的帮助下,ai取得了革命性的进步,达到了可以战胜大部分人类的水平,但随着摩尔定律走向终点,计算机硬件的快速发展速度在以往的道路上暂时以以前的速度迅猛发展。

根据个体的理解,曾将围棋的思考过程分解为常识→棋感→计算→评价这4个阶段的进化。

大约一年前,我和李瓆七段简单讨论过这个问题。 当时,我认为蒙特卡罗算法的成功首要在于在人工智能中确立了“将棋感”,但以往的人工智能只在“常识”和“计算”上具有天然的特征。

在蒙特卡罗算法之前,计算机可以通过强大的计算力积累很多“常识”,但由于缺乏“手感”,人工智能无法有效筛选计算方向,最终陷入了乏力的探索。

虽然蓝力拱可以实现一定程度的“计算”,但甚至其他许多象棋类都在这一阶段被人工智能打败,但由于围棋的过多和摩尔定律结束了对计算机快速发展前景的限制,到目前为止

(注:上图是电脑眼中的国际象棋落子的想法,下图是电脑眼中的围棋落子的想法。 来自Googledeepmind官网alphago | google deepmind )

蒙特卡罗算法出现后,以大量储备的局面为基础,根据胜负概率评估下一个点作为计算方向,大大提高了计算效率,因此ai的水平取得了革命性的进步。

这次的阿尔法go采用了深度神经互联网和蒙特卡罗树检索相结合的方法。

根据已经看到的nature的论文,“谷歌人工智能击败欧洲围棋冠军时,alphago是怎么做到的? 》中,研究人员在alpha go中加入了两个深度神经网络,在value networks中判断大量的选择,在policy networks中选择落子,组合了蒙特卡罗算法和以上两个神经网络,

“谷歌AlphaGo的胜利:不是计算机打败了人类,而是人类打败了人类”

(注:上图为alpha go采用的神经互联网结构示意图,来自原论文)

在这个组合下,研究者们将借鉴人类职业对局的监督性学习与ai在自我对战中实现的深度学习大量积累相结合,训练和提高ai的围棋实力。

蒙特卡罗算法后,我看到了新天地。 这样的结合和新思维,让我们感到前途无限的可能性。

最后说吧。 我认为这是我们应该持有的态度。

在这里,我想首先引用李瑶七段今天早上说的话:

“(/S2 ) ) )我们来到了两个时代的接点。 不管你愿不愿意,这都是必须接受的事实。 工具无善恶,善恶在人心。 通向未来的道路将由我们自己决定。 ”

从清晨到清晨,在微信的朋友圈评论区一直争论不休,甚至有一个世界冠军说“难以置信”。 果然,大家不看板上的钉子之前,还是不想感情用事地相信。 另外两位一线棋手对他说,棋谱可以看了……。

面对这一点,接下来会有很多爆炸性的信息报道和各种姿势的讨论。

我们需要知道的是:

一.人工智能确实取得了很大的进步。

这次的进步可能是革命性的,但这次信息主张的ai成绩不是“基准”。

(/S2/)2.人工智能还没有战胜人类(所谓“人类最后的骄傲沦陷”都属于“模范党”) (/S2/)。

但是,朝着这个方向迈出了一大步。 而且,在蒙特卡罗之后,在很多人不期待ai下一次快速发展的情况下,突然袭击降临了(谷歌从开始研究到拿出成果发表,一直忍耐着大信息也可以忍受)。

.人工智能战胜人类的时间点,可能比许多人想象的要早。

不是在以往认为的生物计算机和量子计算机出现之后,就是在新材料取代硅片之后,也有可能出现在这个时代。 也许是50年后,也许是20年后,也许是10年后。

从小学开始,我就沉迷于许峰雄教授对计算机国际象棋项目的研究和成果,一直跟踪到97年卡斯帕罗夫战胜“深蓝”。 ★之后不久,我从国际象棋转到了围棋……。

(注)上面的照片是第一个打败人类的计算机国际象棋程序“深蓝色”的父亲许峰雄) )。

从中学时代到大学时代,我一直在追求徐教授的动态和他写的各种文案、书籍。 他写的《深蓝》被我翻烂了。 我想把这个作为将来的学问从研究的方向学习到中学时代。

在徐教授离开ibm,去了亚研院,坚持要解决最终问题——计算机围棋难题之后,我还是每年都期待着徐教授之后的动向。

但是,十多年过去了,等待着的是无数的后来者。

这个也不错啊。 人类不可缺少后来者。

看到许教授对那一年的研究过程的叙述,最大的感受如下。

其实不是计算机打败了人类,而是人类打败了人类。

众多计算机专家与众多国际象棋棋手合作,在算法上不断进行改革创新,乘着摩尔定律的东风,不断失败后重做,失败后修正,最终解决了计算机国际象棋难题。

卡斯帕罗夫是一股输给数百名人类专家智慧的力量。

围棋也一样。 据说计算机——今天,人工智能更合适。 战胜人类的日子迟早会到来。 大多数人不否认这一点。

争论始终在这一天的早晚。

棋手和围棋相关人士出于可以理解的感情,希望这一天不要来得太早,但他们绝对不会拒绝或憎恨这一进步。

其实我看到的很多人都期待并称赞人工智能的进步。 此外,许多专业高手参与和资助计算机围棋项目的研究。 我们努力制作“大玩具”、能战胜自己的“大玩具”。

所以最终的成功是我们人类自身的成功,不应该对计算机感到恐惧。

而这个“大玩具”也不仅仅是有趣的,人工智能对现代乃至未来科学技术的快速发展具有重大意义,其意义将超过当时原子弹研究的后续红利。

所以不要害怕,不要烦恼,期待人工智能在围棋上战胜人类的一天吧。

我以为我有生之年看不到这一天,但现在好像错了。

我有些人并不失望,反而兴奋和兴奋。 同时,我们也期待着以谷歌和脸书为首的尖端研究小组们更加活跃。 最后,谷歌,围棋,恭喜人类。

另外,副本先由知乎(我的知乎id :高飞龙)发送。 我想和雷锋网的网民一起分享,欢迎讨论留言。

推荐阅读:

1、谷歌人工智能打败了欧洲围棋冠军。 阿尔法go到底是怎么做到的?

2、谷歌人工智能突破围棋。 然后呢?

来源:UI科技日报

标题:“谷歌AlphaGo的胜利:不是计算机打败了人类,而是人类打败了人类”

地址:http://www.ulahighschool.com/uiitzx/1200.html