AlphaGo团队:对比李世乭的AlphaGo LeeMaster升了3子 但并不比深蓝聪明

导读 棋王柯洁跟升级版AlphaGo对决首仗败北后慨叹对手有如围棋上帝,AlphaGo的科研团队今天在乌镇研讨会上介绍了现在的AlphaGo Master是什

棋王柯洁跟升级版AlphaGo对决首仗败北后慨叹对手有如围棋上帝,AlphaGo的科研团队今天在乌镇研讨会上介绍了现在的AlphaGo Master是什么一回事——相比去年3月跟韩国李世乭对决的AlphaGo Lee升了3子。

新浪报道,团队用图像说明对AlphaGo不断演变的评估,指出当其他围棋人工智能(AI)如Zen或Crazy Stone的等级分是相当于近2000时,2015年10月与樊麾一决高下的AlphaGo Fan就相当于接近3000等级分。去到李世乭时,是提升到3500以上等级分,而目前的AlphaGo Master则达4500以上等级分。回头看世界排名第一的柯洁是3620等级分,排名第二的韩国朴廷桓是3593。

不过。DeepMind的首席设计师大卫席尔瓦表示,其实AlphaGo并不是比深蓝更聪明(DeepBlue是由IBM开发的AI,1997年打败西洋棋世界冠军卡斯巴罗夫),只是减少了搜索範围。他说,AlphaGo使用的卷积神经网路(Convolutional Neural Network,是深度学习技术中具代表性的网络结构),原版有12层,Master则有40层。AlphaGo Master版本之所以更强大,是提升了策略网络(Policy Network,计算可能的落子位置)和价值网络(Value Network,评估每一步的胜率有多少),在宽度和深度都简化了搜索。

如果用穷举法(exhaustive search),涉及的範围太大,透过策略网络和价值网络,可以聚焦几个可能性,再降低搜索的深度。这个过程会重複千百次,以算出哪一步棋的胜率最高。对李世乭的AlphaGo Lee在Google cloud上的运作是50 TPUs,而AlphaGo Master则是单个TPU的运作。AlphaGo先通过人类棋谱进行监督学习,再而是自我对局千百万次,成为自己的老师,从自己的搜索找出最好的数据。在过程中,目标是要找到最完美的棋局,在3000年的对弈中都不足以找到最佳棋局。AlphaGo就是要帮助人类去探求。

DeepMind创办人哈萨比斯说,正如卡斯巴罗夫曾说过,深蓝已结束,但AlphaGo才刚开始,他希望打造完美的AlphaGo,又说AlphaGo有点像一代棋圣吴清源在三四十年代为围棋开创了新时代。Google母公司Alphabet董事长埃里克·施密特表示,赛前料不到AlphaGo同柯洁比赛会表现如何,如果是差距非常小,可见柯洁是做足準备而来。估计柯洁也借鉴了AlphaGo之前对李世乭的套路。一如李世乭当年也尽力试图打败AlphaGo,他是非常期待明天第二局比赛(早上10:30)。

人工智能论坛:AlphaGo团队分享技术细节(更新) (新浪)

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章