《AI背后的暗知识》:「明知识」、「默知识」与既不可感受也不能表达的「暗知识」

导读 文:王维嘉 可表达的「明知识」 目前,脑神经科学的最新研究发现,可表达的记忆并不是对应着一组固定神经元的连接,而是

文:王维嘉

可表达的「明知识」

目前,脑神经科学的最新研究发现,可表达的记忆并不是对应着一组固定神经元的连接,而是大致地对应于散布在大脑皮层各处的一些连接。原因是用来表达的语言和文字只能是体验的概括和近似。这类可以用语言表达或数学公式描述的知识就是人类积累的大量「正式知识」,也可以称为「明知识」。它们记载在书籍、杂誌、文章、音讯等各种媒体上。要想把某种关联表达出来,人类唯一的方法是通过语言和符号。语言和符号表达的第一个前提是要有概念。所谓概念就是某个特定的发音或符号稳定地对应于一个事物或行为。大部分的名词和动词都是这样的概念。第二个前提是每个概念都不同于其他概念,猫就是猫,狗就是狗,不能把猫叫成狗,或者把狗叫成猫,两者要能区分开。这叫「同一律」。第三个前提是猫不能同时也不是猫,黑不能同时也是白。这叫「不矛盾律」。

有了这些基本前提,根据已知的事物间的关係我们就可以推导出新的知识或者论证一个决定的合理性。推理、假设、联想,这些本质上都是建立在语言之上的思维活动,没有语言就完全无法思维。所有的正常思维都要借助概念,要遵循「同一律」和「不矛盾律」。语言是人类和所有动物的最大区别。黑猩猩可以学会很多概念,譬如「我」「吃」和「香蕉」等,但无论实验人员如何训练黑猩猩,它们都无法组合出「我要吃香蕉」这样的句子。人的语言能力的本质是什么? 它的生物学基础是什么? 语言和自我意识是什么关係? 目前这些都还不清楚。但我们知道,人类语言是不精确的,越基本的概念越不容易定义清楚,像「公平」「理性」等。人类语言中有大量含混和歧义的表述,像「今天骑车子差点滑倒,幸亏我一把把把把住了」。

英国哲学家罗素企图把语言建立在精确的逻辑基础之上,他用了几百页纸的篇幅来证明1+1=2。德国哲学家维特根斯坦(Ludwig Wittgenstein,1889~1951)认为人类有史以来几乎所有的哲学辩论都源于语言的模糊不清,因而没有任何意义。他认为在世界中只有事实有意义,在语言中只有那些能够判断真伪的论断才能反映事实。他的结论是:我们的语言受限,因而我们的世界受限。

为什么语言的表达能力受限? 用资讯理论的方法可以看得很清楚。我们大脑接收的环境讯息量有多大?一棵树、一块石头、一条狗都包含几十MB(百万位元组)甚至几十GB(千百万位元组)的数据,我们的感觉接收神经元虽然大大简化了这些资讯,但它们向大脑传导的讯息量仍然非常大,表1.1是各个感觉器官每秒钟能向大脑传递的讯息量。

大脑存储这些资讯的方式是神经元之间的连接,大脑在存储时可能进一步简化了这些资讯,但它们的讯息量仍然远远大于我们语言所能表达的讯息量。人类语言的最大限制是我们的舌头每秒钟只能嘟噜那么几下,最多表达几十个比特的意思。(比如读书,我们平均每分钟能读300字,每秒读5个字=40比特。)这样大脑接收和存储的资讯与能用语言表达出来的讯息量就有六个数量级的差别。也就是说极为丰富的世界只能用极为贫乏的语言表达。许多複杂事物和行为只能用简化了的概念和逻辑表达。这就是人类语言的基本困境。

只可意会的「默知识」

由于舌头翻卷速度严重受限,以神经元连接形式存在大脑中的人类知识只有极少一部分可以被表达出来。而绝大部分知识无法用语言表达,如骑马、打铁、骑自行车、琴棋书画,察言观色、待人接物、判断机会和危险等。这些知识由于无法记录,所以无法传播和积累,更无法被集中。英籍犹太裔科学家、哲学家波兰尼(Michael Polyani,1891~1976)称这些知识为「默会知识」或者「默知识」。

波兰尼举了骑自行车的例子。如果你问每个骑自行车的人是怎么保持不倒的,回答会是「车往哪边倒,就往哪边打车把」。从物理学上可以知道,当朝一个方向打把时会产生一个相反方向的离心力让车子平衡。甚至可以精确计算出车把的转弯半径应该和速度的平方成反比。但哪个骑自行车的人能够知道骑车的速度呢? 即使知道谁又能精确地把转弯半径控制在速度平方的反比呢? 所有骑自行车的人都是凭身体的平衡感觉左一把右一把地曲折前进。世界上大概没有一个人学骑自行车是看手册学会的,事实上也没有这样的学习手册。大部分技能类的知识都类似。默知识和明知识主要有以下四点区别:

(1)默知识无法用语言和文字描述,因此不容易传播,无法记录和积累,只能靠师傅带徒弟。像大量的传统工艺和技能,如果在一代人的时间里没人学习就会从历史上彻底消失。

(2)获取默知识只能靠亲身体验,传播只能靠人与人之间紧密的互动(你第一次骑自行车时你爸在后面扶着)。而这种互动的前提是相互信任(你不敢让陌生人教你骑自行车)。获得默知识必须有反馈回路(骑自行车摔了跤就是姿势错了,不摔跤就是姿势对了)。

(3)默知识散布在许多不同人的身上,无法集中,很难整合,要想使用整合的默知识需要一群人紧密协调互动。由于无法言传,所以协调极为困难(比如杂技叠罗汉)。

(4)默知识非常个人化。每个人对每件事的感觉都是不同的,由于无法表达,因而无法判断每个人感觉的东西是否相同。

基于对默知识的理解, 奥地利经济学家哈耶克(Friedrich Hayek,1899~1992)论证了市场是最有效的资源配置形式。因为市场上的每个人都有自己不可表达的、精微的偏好和细腻的需求,而且没人能够精确完整地知道其他人的偏好和需求,也就是说供需双方实际上无法直接沟通。供需双方最简洁有效的沟通方式就是通过商品的价格。在自由买卖的前提下,市场中每个人只要根据价格信号就可以做出决定。价格可以自动达到一个能够反映供需双方偏好和需求的均衡点。一个价格数字,就把供需双方的无数不可表达的资讯囊括其中。这种「沟通」何其简洁,这种「协调」何其有效,这种自发形成的秩序何其自洽。哈耶克根据同样的道理论证了国家或政府永远都无法集中这些不可表达的分散讯息。

在机器学习大规模使用之前,人类对于默知识没有系统研究。但现在我们发现机器非常擅长学习默知识。这就给我们提出了三个严肃的问题。

(1)默知识在所有知识中占比有多大?

(2)默知识在人类社会和生活中有多大用处?

(3)如何使用默知识?

第一个问题的简单粗暴的回答是默知识的量远远大于可陈述的明知识。原因是事物的状态很多是难以观察的,更多是不可描述的。人类的描述能力非常有限,只限于表达能力极为有限的一维的语言文字。在所有已经产生的资讯中,文字只占极少的比例,大量的资讯以图片和影片方式呈现。人类现代每年产生的各种文字大约是160TB。世界最大的国会图书馆有2000万册书,几乎涵盖了人类有史以来能够保存下来的各种文字记录,就算每本书有100万字,这些书的总讯息量也只有20TB。而目前用户每分钟上传到YouTube的影片是300小时,每小时影片算1GB,每年上传的量就是157680TB。如果把每个人手机里的影片都算上,那么影片资讯是文字资讯的上亿倍。今后这个比例还会不断加大。虽然这些影片或图片都是「资讯」,还不是「知识」,但我们也可以想像从影片图片中能提取出的隐藏的相关性的量一定远远大于所有的文字知识。

有了第一个问题的答案,就容易回答第二个问题。很显然,用机器学习从影片和图片中萃取知识是人类认识世界的一个新突破,只要有办法把事物状态用图片或影片记录下来,就有可能从中萃取出知识来。如果影片和图片的讯息量是文字的上亿倍,那么我们有理由期待从中萃取出的知识呈爆炸式增长,在社会和生活中起到关键甚至主导作用。人工智慧通过观看大量人类历史上的影视作品,可以归纳提取出影视中的经典桥段,创作出新颖的配乐、台词和预告片,供人类借鑒或使用。

2016年,IBM(国际商业机器公司)的沃森系统为二十世纪福克斯电影公司的科幻电影《摩根》(Morgan)製作了预告片。IBM的工程师们给沃森看了100部恐怖电影预告片,沃森对这些预告片进行了画面、声音、创作构成的分析,并标记上对应的情感。它甚至还分析了人物的语调和背景音乐,以便判断声音与情感的对应关係。在沃森完成学习后,工作人员又将完整的Morgan电影导入,沃森迅速挑出了其中10个场景组成了一段长达六分钟的预告片。在沃森的帮助下,製作预告片的时间由通常的10天到1个月,缩减到了短短的24个小时。同样道理,机器学习可以从海量的生态、生产和社会环境资料中萃取出大量的未曾发现的知识。

第三个问题最有意思。由于机器萃取出的知识是以神经网路参数集形式存在的,对人类来说仍然不可陈述,也很难在人类间传播。但是这些知识却非常容易在机器间传播。一台学会驾驶的汽车可以瞬间「教会」其他100万台汽车,只要把自己的参数集複製到其他机器即可。机器间的协同行动也变得非常容易,无非是用一组回馈信号不断地调整参加协同的每台机器的参数。

如果用一句话总结默知识和明知识的差别那就是波兰尼说的:We know more than we can tell(知道的远比能说出来的多)。

明知识就像冰山浮出水面的一角,默知识就是水下巨大的冰山。这两类知识也包括那些尚未发现的知识,一旦发现,人类要么可以感受,例如第一个登上珠峰的人能感受到缺氧;要么从理性上可以理解,例如看懂一个新的数学定理的推导过程。

既不可感受也不能表达的「暗知识」

既然可以感受(但不可表达)的是默知识,可以表达的是明知识,那么机器刚刚发现的,既无法感受也无法表达的知识就是暗知识。我们用是否能感受作为一个坐标轴,用是否能表达(或描述)作为另一个坐标轴,就可以用图1.3把三类知识的定义清晰地表达出来。在这张图里,明知识又被分为两类:第一类是那些既可以感受又可以表达的,例如浮力定律、作用力反作用力定律等。第二类是不可感受可以表达的,如大部分的数学以及完全从数学中推导出来但最后被实验验证了的物理定律,以及相对论和量子力学。

为了理解暗知识的本质,我们必须先搞清楚「知识」与我们今天常用的「资讯」和「资料」有什么不同。稍加研究就能发现关于资讯、资料和知识的定义有很多并且非常混乱。笔者在下面给出一组符合资讯理论和脑神经科学研究结果的简单而自洽的定义。资讯是事物可观察的表徵,或者说资讯是事物的外在表现,即那些可观察到的表现。在我们没有望远镜时,谈论肉眼以外星空里的资讯毫无意义。

资料是已经描述出来的部分资讯。任何一个物体的讯息量都非常大,要想精确地完全描述一块石头,就要把这块石头里所有基本粒子的状态以及它们之间的关係都描述出来,还要把这块石头与周围环境和物体的关係都描述出来。而关于这块石头的资料通常则少得多,例如它的形状、重量、颜色和种类。

知识则是资料在时空中的关係。知识可以是资料与时间的关係,资料与空间的关係。如果把时间和空间看作资料的一部分属性,那么所有的知识就都是资料之间的关係。这些关係表现为某种模式(或者说模式就是一组关係)。对模式的识别就是认知,识别出来的模式就是知识,用模式去预测就是知识的应用。开普勒的行星运动定律就是那些观测到的资料中呈现的时空关係。牛顿定律的最大贡献可能不在于解释现有行星的运动,而在于发现了海王星。这些资料在时空中的关係只有在极少数的情况下才可以用简洁美妙的数学方程式表达出来。在绝大多数情形下,知识表现为资料间的相关性的集合。这些相关性中只有极少数可以被感觉、被理解,绝大多数都在我们的感觉和理解能力之外。

人类的理解能力由感受能力和表达能力组成。人类的感受能力有限,局限性来自两个方面。一是只能感受部分外界资讯,例如人眼无法看到除可见光之外的大部分电磁波频谱,更无法感受大量的物理、化学、生物和环境资讯。一是人类的感官经验只局限在三维的物理空间和一维的时间。对高维的时空人类只能「降维」想像,用三维空间类比。对于资料间的关係,人类凭感觉只能把握一阶的或线性的关係,因为地球的自转是线性的,所以「时间」是线性的。例如当我们看到水管的水流进水桶里时,水面的上升和时间的关係是线性的,我们凭感觉可以预测大概多长时间水桶会满。人类感官对于二阶以上的非线性关係就很难把握。例如当水桶的直径增加一倍时,水桶能盛的水会增加四倍,这点就和「直觉」不相符。

人类的表达能力只限于那些清晰而简单的关係,例如少数几个变数之间的关係,或者是在数学上可以解析表达的关係(「解析表达」的意思就是变数之间的关係可以用一组方程式表达出来)。当资料中的变数增大时,或当资料间的关係是高阶非线性时,绝大多数情况下这些关係无法用一组方程式描述。所以当资料无法被感受,它们之间的关係又无法用方程解析表达时,这些资料间的关係就掉入了人类感官和数学理解能力之外的暗知识大海。

我们现在可以回答「一个人类无法理解的暗知识的表现形式是什么样的」,暗知识在今天的主要表现形式类似AlphaGo Zero里面的「神经网路」的全部参数。在第三章详细介绍神经网路之前,我们暂时把这个神经网路看成一个有许多旋钮的黑盒子。这个黑盒子可以接收资讯,可以输出结果。黑盒子可以表达为一个一般的数学函数:Y=fw(X)。这里Y是输出结果,fw(X)是黑盒子本身,X是输入资讯,w是参数集,就是那些旋钮,也就是暗知识。

我们如何知道这个函数代表了知识,也即这个函数有用?这里的判别方法和现代科学实验的标準一样:实验结果可重複。对AlphaGo Zero来说就是每次都能赢;用严格的科学语言来说就是当每次实验条件相同时,实验结果永远可重複。读完第三章,读者就会从细节上清楚暗知识是如何被验证的。

注意,暗知识不是那些人类尚未发现但一经发现就可以理解的知识。比如牛顿虽然没有发现相对论,但如果爱因斯坦穿越时空回去给他讲,他是完全可以理解的。因为理解相对论用到的数学知识如微积分牛顿都有了。即使在微积分产生之前,如果爱因斯坦穿越2000年给亚里斯多德讲相对论,亚里斯多德也能理解,至少能理解狭义相对论背后的物理直觉。但如果给亚里斯多德讲量子力学他就不能理解,因为他的生活经验中既没有薛定谔的猫(用来比喻量子力学中的不确定性,一个封闭的盒子里的猫在盒子没打开时同时既是死的也是活的,一旦打开盒子看,猫就只能有一种状态,要么是死要么是活),他的数学水準也无法理解波动方程。那么我们可以说对亚里斯多德来说,量子力学就是暗知识。量子力学因为没有经验基础,甚至和经验矛盾,在刚发现的初期,几乎所有的物理学家都大呼「不懂」,至今能够透彻理解的人也极少。甚至连爱因斯坦都不接受不确定性原理。

人类过去积累的明知识呈现出完美的结构,整个数学就建立在几个公理之上,整个物理就建立在几个定律之上,化学可以看成是物理的应用,生物是化学的应用,认知科学是生物学的应用,心理学、社会学、经济学都是这些基础科学的应用组合。这些知识模组之间有清晰的关係。但是机器挖掘出来的暗知识则像一大袋土豆,每个之间都没有什么关係,更準确地说是我们不知道它们之间有什么关係。

我们可以预见一幅未来世界的知识图谱:所有的知识分为两大类界限分明的知识——人类知识和机器知识。人类的知识如果不可陈述则不可记录和传播。但机器发掘出来的知识即使无法陈述和理解也可以记录并能在机器间传播。这些暗知识的表现方式就是一堆看似随机的数位,如一个神经网路的参数集。这些暗知识的传播方式就是通过网路以光速传给其他同类的机器。

暗知识给我们的震撼才刚刚开始。从2012年开始的短短几年之内,机器已经创造了下面这些「神蹟」:对複杂病因的判断,準确性超过医生;可以惟妙惟肖地模仿大师作画、作曲,甚至进行全新的创作,让人类真假难辨;机器飞行员和人类飞行员模拟空战,百战百胜。

我们在第六章会看到更多这样的例子。人类将进入一个知识大航海时代,我们将每天发现新的大陆和无数金银财宝。我们今天面对的许多问题都像围棋一样有巨大的变数,解决这些问题和围棋一样是在组合爆炸中寻求最优方案,例如全球变暖的预测和预防、癌症的治癒、重要经济社会政策的实施效果、「沙漠风暴」这样的大型军事行动。系统越複杂,变数越多,人类越无法把握,机器学习就越得心应手。无数的机器将不知疲倦地昼夜工作,很快我们就会发现机器新发掘出来的暗知识会迅速积累。和下围棋一样,暗知识的数量和品质都将快速超过我们在某个领域积累了几百年甚至几千年的知识。明知识就像今天的大陆,暗知识就像大海,海平面会迅速升高,明知识很快就会被海水包围成一个个孤岛,最后连圣母峰也将被淹没在海水之下。

这场人类认知革命的意义也许会超过印刷术的发明,也许会超过文字的发明,甚至只有人类产生语言可与之相比。请繫好安全带,欢迎来到一个你越来越不懂的世界!

书籍介绍

本文摘录自《AI背后的暗知识:机器如何学习、认知与改造我们的未来世界》,大写出版

*透过以上连结购书,《关键评论网》由此所得将全数捐赠联合劝募。

作者:王维嘉

没人能逃离人工智慧+机器学习的巨大力量: 今天的机器已不断探索出那些隐藏在海量资讯中的相关性,以及万事万物间的隐蔽关係。 这些人类既无法感受,也无法描述与表达的「暗知识」,将彻底重塑世界!

深刻理解AI的本质,就能对未来更有方向感 人工智慧很可能导致一场人类社会旧秩序的永久性改变,而这一切或许会比所有人想像的更快发生。

如果你留意最近几年科技的发展,你会发现,到处都暗示着我们对于生存的认知将被下一阶段的发展而彻底改变。

在这本由一位人工智慧参与者/硅谷风投家亲撰、题旨宏大却又简练解释了当前科技进程的书中指出,人类或许永远能自知「所知有限」,但AI与机器学习的出现,则让我们进入了一个全新的未来领域。作者主张:

「我们可以预见一幅未来世界的知识图谱:所有的知识分为两大类界限分明的知识:人类知识和机器知识。人类的知识如果不可陈述则不可记录和传播。但机器发掘出来的知识即使无法陈述和理解也可以记录并能在机器间传播。这些『暗知识』的表现方式就是一堆看似随机的数位,如一个神经网路的参数集。这些暗知识的传播方式就是通过网路以光速传给其他同类的机器。」

「暗知识给我们的震撼才刚刚开始。从2012 年开始的短短几年之内,机器已经创造了下面这些「神蹟」:对複杂病因的判断,準确性超过医生;可以唯妙唯肖地模仿大师作画、作曲,甚至进行全新的创作,让人类真假难辨;机器飞行员和人类飞行员模拟空战,百战百胜。……人类将进入一个知识大航海时代,我们将每天发现新的大陆和无数金银财宝。」

过去人们总把人工智慧(AI)当成科幻电影中才会出现的情景,可近年来不断有人严肃的讨论这个问题,同时也让我们感到困惑,由于我们总把人工智慧跟虚构的电影情节连想在一起,也可能是人工智慧可以用来的描述事物太多了,从电子计算机、自动驾驶车到智慧医疗,它已经存在于我们生活中了,可是它到底是什么?

这本书就将告诉你目前所谓的人工智慧是什么?AI背后许多听来极度专业又带有资讯工程最前瞻性的工具及技术,如机器学习/卷积网路/深度学习等,到底能不能用简单方式说明白?

本书也是一本写给一般人及非资讯科学专业人士得以理解AI全局的定义性读物,作者师从人工智慧的学术大师伯纳德.威罗,并企图以知识的概念——「内隐知识」为比喻出发,带领读者了解目前AI正在攻坚的方向,这些人类过去仅能靠想像存在的「聪明机器」是如何学会了人类世界过去无法有效解决的治理需求,它们的背后有何「暗知识」使得机器得以靠传感器、物联网累积的大量资讯及新的机器学习工具做出比人类更卓越、有如神蹟般的表现?

看完本书,你将了解:AlphaGo为何得以战胜人类最杰出的围棋棋士,而且也将在某些事物上更长期的占据「人机对奕」的优势。本书同时也要解答:

AI应用的「暗知识」会对经济与社会造成哪些直接冲击? 机器学习如何从资料中挖掘暗知识? 机器认知将颠覆什么行业,不同行业里又有哪些新的投资机会和陷阱? 神经网路的基本工作原理与当前最接近商业应用的形态 AI对哪些行业的冲击已经或即将发生?哪些行业的AI应用则在目前看不到「取代性」的可能? AI对人类管理的城市与社会将颠覆性的改变有哪些? ……以及最重要的,你我对这个「许多事务都将由机器治理接管」的时代,该如何因应与準备?

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章