问答

阿尔法狗大战李世石 为什么李世石能赢阿尔法狗一局

为什么李世石能赢阿尔法狗一局

比赛结束,alphago四比一完胜李世石,仅胜利第四局(不是第五局)还可能是谷歌为了让alphago有世界排名而故意输的一局,因为如果一个棋手一直连胜,是没有世界排名的,输了一局才有排名,按照官方发布目前alphago排名世界第二,中国小将柯杰世界第一。这种说法不无道理。 谷歌非常有谋略,先让阿尔法狗连赢三次,奠定胜利的事实,展示人工智能的厉害!让人恐慌! 然后,谷歌让阿尔法狗输棋给李世石,以明白无误的方式告诉恐慌的人们:不要害怕,我们掌控着人工智能的! 如果人工智能把人逼上绝路,人工智能产业就会遭到人们的封杀! 谷歌输一局,缓和局面。 中日韩还有成千上万围棋学习者和相关从业人员,Google是商业公司,当然不会把事情做绝,肯定会考量这方面的因素。

阿尔法狗最终以总分41战胜李世石,说明了什么哲学原理

人工智能的算法还是比人脑好用。

阿尔法狗大战李世石

如何评价阿法狗击败李世石

写在阿尔法围棋完胜人类棋手之前 2016-3-7 22:11:00

       后天,3月9号阿尔法围棋将和围棋世界冠军李世石展开围棋对抗。这次对抗的意义非同一般,是“人类捍卫智慧之战”、是“人工智能开辟新时代之战”、是显现“人类智慧的最后骄傲是否崩塌之战”。太多的关注、太多的猜测、乃至加之的若干惊恐都扑面而来!

     我的猜测是机器完胜。原因并不复杂,一是阿尔法围棋在去年已经有了良好的战绩,它5:0的优异成绩战胜了欧洲冠军,这冠军虽然据说只是相当与职业棋手二段,但必定是职业选手。而机器的表现,有好多的围棋行家都认为行棋过程看不出是机器所为,证明机器绝对有不一般的水平。第二,机器具有学习能力,而且人类棋手一年最多也练习1000盘的围棋,但是机器一天就能下100万局围棋,都是练习相差极其巨大。第三,机器不会疲劳不易犯错,而人类棋手不但会疲劳还会经常受到情绪的影响,出错是在所难免。第四,阿尔法围棋通过这一段时间的炒作,已经给谷歌公司带来了巨大的商业利益,这一定是谷歌公司提前设计有备而来的一部分内容之一,而这场人机大战的重头戏在后面,谷歌公司一定会有更好的设计、更多的努力、更周密的准备,而这一切一定不会是让机器输棋。

     我们怎样认识这次人机大战?我们应该是怎样的心态?我的观点如下:

     一,本次人机大战是人类众多的最普通的活动之一,只是为社会进步和科技发展进行的一次科技实践。

     二,不管是谁取得胜利,无疑仍然是人类的胜利、人的胜利!都是可喜可贺。

     三,如果是人输给了机器,说明了我们祖先发明的玩具终于在科技飞速发展的今天落后了,说明围棋落后了。

      四,如果是机器输给了人,说明我们现代人的努力还不够,机器的进步还很慢,说明祖先几千年前设计的玩具我们都玩不透,反衬我们的祖先的聪明伟大。

    五,实际上围棋也好、机器也好都是人类的玩具!请大家相信,对于所有的这些,人类哪一个落后就会改进那个。不信大家拭目以待!

     我判断机器会完胜人类棋手有我心里的一套逻辑,实际上我最想说的是这句话:我们祖先设计的玩具开始落后了,象棋落后了、国际象棋落后了、围棋落后了!

(这是当时写在大师网博客的一篇)

阿尔法狗的学习方法

阿尔法狗的学习策略:


①学习高手套路、背棋谱,取得在当前局面下,赢率最大的几种走法


麦肯锡有一句著名的话叫“不要重新发明轮子”,牛顿也说过,他能成功的秘诀就是“站在巨人的肩膀上”。


其实一开始的阿尔法狗并没有学习高手套路,当时它只能到一个高级业余选手的水平。后来学习了百万数量级别以上的世界顶尖一流高手棋谱,才能战胜李世石。


所以想要炼成高手,非常关键的一点叫“学习高手套路”(天生的绝世天才不在讨论范围)。


小马宋在做广告的初期就阅读了几万个世界上最好的创意广告,摸到了套路,然后在戛纳广告节拿到了奖。


自媒体大咖咪蒙,她的电脑里,有海量的优秀素材库,她说连看到文笔好的色情短信都会记下来,把这些素材定期整理,分门别类。然后,最可怕的是,咪蒙会把这些优秀的素材,都背下来,转到脑子里。


是的,都背到脑子里!


正是她脑海里面有这样海量的“高手棋谱”,所以写文章的时候才能运用自如。


②计算走法赢率,选赢率最高的走法


在第一步里,通过搜寻高手棋谱,找到相似局面的几种走法,那采用哪种呢?这时就需要计算了。


按照现在的走法走下去,电脑模拟的对手也相应地跟它对弈,总有一刻会分出胜负,这时回顾胜利和失败的历史轨迹,就知道走哪一步赢的概率更加高。每一步都这么计算,使得每一步采取的都是赢率最大的走法。


但是这样计算量还是很大怎么办,这就采取了一种叫“估值网络”的算法。“估值网络”不需要跑完整个比赛,而是直接算出这个走法可能的回报。


比如说现在的共享单车大战,不用真的算到终局,而是反观当年的出租车大战,就能猜出大致的结果了,最后基本是靠资本靠“爸爸”获胜。


③自我博弈


只学习高手套路,你还是无法超越他,那怎么办?就要靠自我博弈了。


阿尔法狗让现有的策略网络和随机选出一个之前的策略网络进行左右互搏,然后把胜负结果回传到每一步的策略上,进行梯度训练。


本来阿尔法狗输给了李世石,但是它回去一夜时间自己跟自己下了上百万盘棋(不记得具体数据量级了,反正很多就对了),然后就把李世石打败了。


就拿诸葛亮来说,他也不是天生就有如此聪慧过人的智谋的。他有四位当今天下高手名师,一是沔南名士黄承彦,二是庞德公,三是司马徽(人称“水镜先生”),四是酆公玖。


庞德公将自己花了半生时间研究兵法的成果——从八卦到八阵的推演都交给了诸葛亮,他希望诸葛亮能够据此推演出完善的八阵图本,他甚至没有将自己的成果传给亲生的儿子。


酆公玖将自己一生所著《三才秘录》、《兵法阵图》、《孤虚相旺》、《大战奇观》等都赠与诸葛亮。


诸葛亮也曾研读《孙子兵法》,但一开始也不得其解,后来看到了曹操新注的《孙子兵法》,认识到自己是井底之蛙。在庞德公教授兵法给他之后,他又在黄承彦的指点下研制出了八阵草图,庞德公又告诉他:“八阵通不通, 须拜司马公!”在司马公的指点之下,他又不断完善他的八阵图。


最后他把这些高手的套路都吸食了,并且推演出了自己的独家阵法,对的,是独家的阵法,虽然他跟这么多高手学习,但是他没有只学习他们,而是推演出自我思想出来,才成为了名传千古的智囊名谋。


只有进化和自我改进思想,才是最终战胜高手的取胜法器。




用一句话总结,就是在巨人的肩膀上迅速试错,边描摹那三千万精英的步法,并深度总结其规律, 然后再变化自己的动作花样。

阿尔法狗大战李世石

相关新闻

联系我们

联系我们

400-800-7470

在线咨询: 点击这里给我发消息

邮件:admin@notoy.cn

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
关注微信
分享本页
返回顶部