AlphaGo下的棋看不懂「空压法」或许可以成为我们理解AI围棋的切入口

导读 文:王铭琬 与AI一样:由概率出发 赵治勋是史上获得最多头衔的棋士,二○一六年十一月他以二胜一败击败製围棋AI的DeepZe

文:王铭琬

与AI一样:由概率出发

赵治勋是史上获得最多头衔的棋士,二○一六年十一月他以二胜一败击败製围棋AI的DeepZengo后,记者问他:「DeepZengo下得像谁呢?」赵治勋毫不犹豫地说:「像王铭琬!」这并不值得高兴,因为DeepZengo是他手下败将,不过这还是说明,经过紧密的对局过程,可以感觉我的空压法与AI的下法有相似的地方。

空压法与AI最基本的相同,在以概率为基础这一点,AI用强大的计算力算出概率本身,直接选择胜率较高的着点;空压法是用概率为基础做推理与判断,至今围棋技术为了获得确定的知识,在思考时排除概率的想法,虽然有时会用「可能性较高」来解释棋局,不过是为了完成说明的比喻性字眼,不是根本的思考依据。

空压法是尽可能排除既有围棋知识,纯粹用着手所得到的概率回报,去思考次一手,这并非异想天开,其实是很自然的事情,AlphaGo的双剑,「蒙地卡罗方法」与深层学习的单位「人工神经网路」都是以概率处理对象的技术,从AI来看,围棋可说是概率的大海。

最近的脑科学研究,发现人脑的活动与「贝氏网路(Bayesian network)」很相似,贝氏网路就是将因果关係用概率去记述的模式,用概率去理解围棋,对人类本来就是很自然的。

围棋在自己还没算清楚前,对游戏人来说,其实都只是概率的对象,本书在于介绍,人可以藉由自己的判断,以概率为依据,去建构自己的围棋,在本书上集的〈开天篇〉第四章,对人在棋盘上如何面对概率就有不少叙述。

以我个人的能力,尽可能用概率思考围棋得到的结论是,围棋可以用「从宽广方面压迫对方」(压)这个观点去理解,也是制胜的唯一方法,而要达成这个目的必须「开创比对方大的有利空间」(空),这两点也是「空」、「压」法的核心。

围棋知识至今是由局部的探讨开始,像积木般的架构全局,而空压法是跳开局部,一开始就以全局的命题为首要目标,这也是与AI共通的因素。

用空压法去观察AlphaGo、或AlphaGo进阶版Master的棋,是一点都没有违和感的。

从我来看,因为AI本身实力强大,运用空压法比我更为灵活。

从空压法去看围棋AI的下法,到Master的水平为止,我觉得没有问题,很多人说AI下的棋看不懂,空压法或许可以成为我们理解AI围棋的切入口。

围棋深奥无比,目前并不能断定Master的下法优于传统下法,不过空压法的观点,应该能对欣赏AI的棋局有所帮助。

围棋重要的是怎么去想,在同样逻辑下的思考,有时会因人而有不同的答案,可是它们可以说是近亲;而在不同思考下,就算结果下同一个地方,其实是偶然撞在一起,毫不相干的路人。

空压法的起点是认为围棋的变化是无限的,必须要这样的前提才可能运用概率纯粹思考, 然而若围棋的变化是无限的,诠释AI的方法当然不限于空压法,每一个人可以用自己的观点去看待AI围棋,而运用空压法,也可以用每一个人主观的推理与判断,得出不同的次一手。

围棋书的形式往往非常固定,本书避开大多数棋书的写法,尝试介绍围棋多元的乐趣,而在讲解围棋的部分,尽量不用客观的围棋看法,而从对局者本身的主观去探讨围棋;另一方面,本书的内容均取自我自己的正式比赛,可说是真枪实弹,理应具有一点客观的技术价值。

每当我迷失下棋方向时,我都会回到一个原点问题——「为什么要下棋?」我最后得到的答案总是一样的「因为下棋太快乐了」;除了快乐,下棋本身不会带给人任何好处,正因为如此,不管AI棋力如何进步,围棋将永远为我们的人生平添几分幸福。

相关书摘 ►本因坊棋王教你用概率下棋——运用「空压法」,首先要相信自己「一无所知」

书籍介绍

本文摘录自《新棋纪乐园:开天篇》,大块文化出版 *透过以上连结购书,《关键评论网》由此所得将全数捐赠儿福联盟。

作者:王铭琬

在AI与真人棋士对局屡获胜绩后,赵治勋有感而言,王铭琬的棋术最像AI下法。新版《新棋纪乐园》的开天篇和闢地篇两本书,王铭琬将为此做了精闢的解说。

新版《新棋纪乐园──开天篇》中,王铭琬以多观点、对局者的互相趣味对话的方式,将他四十年来棋历的精华,化为快乐围棋祕笈——「空压战法」。「空」是「空间」,也代表了棋盘上所有棋子的位置关係;「压」是「压力」,代表棋盘上棋子的力量关係。「空压战法」是就这两种关係的相关,去推敲下一着最有利的着点。了解了什么是「空间」、怎么算出有利空间、如何「压」、压的对象与原则之后,就能有守有攻下出一盘好棋。王铭琬认为,「空压法」与AI同样都由概率出发。

围棋要学AI下法,就从《新棋纪乐园》开始。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章