【高端访谈】关于“暗知识”和“人工智能”的对话王维嘉（上）

发布时间：2023-12-17 08:00 来源:酒店新闻网新闻中心

浏览量:3282

「导语」AlphaGo战胜了世界围棋冠军，但无论是聂卫平还是设计AlphaGo的谷歌工程师都无法理解AlphaGo为什么这样走棋，这就是人工智能中令人困惑的“不可解释性”问题。从这个问题出发，发现了一类全新的知识——“暗知识”。

一直以来人类知识可分为两类：“明知识”和“默知识”。明知识就是那些可以用语言、文字或公式清晰表达和描述的知识；默知识则是个人在感觉上能把握但无法清晰描述的知识，也即我们常说的“只可意会，不可言传”的那类知识。今天，人工智能突然发掘出了人类既无法感受又无法表达和描述的“暗知识”—隐藏在海量数据中的万事万物间的关系。介绍了机器学习五大流派从数据中挖掘暗知识的方法以及各自适用的领域，尤其是神经网络的基本工作原理和目前在商业上应用广泛的几种形态。

本文是对话录，作为对照，也引述了业界重要研究者的观点和见解，相互验证、互为解读。

价值中国：请您谈一谈，提出“暗知识”概念的相关背景？

王维嘉：过去两年我在硅谷做人工智能方面的投资，同时对那些基础的东西非常有兴趣。

我发现了一个重要的东西叫“暗知识”，“暗知识”就是人类无法理解的知识。什么叫人类无法理解的知识？这还要从阿尔法狗下围棋开始说起。阿尔法狗下围棋，让全世界第一次注意到人工智能的神奇。柯洁在下完棋后痛哭流涕，说我根本不可能打过他。它也让聂卫平五体投地，说阿尔法狗至少是20段。正当我们被阿尔法狗一棒子打晕的时候，他的妹妹又出现了，他的妹妹就是“阿尔法折叠”。2018年年底，谷歌在科学杂志上发布了“阿尔法折叠”的研究成果，根据DNA的序列测出一个蛋白质的三维结构。

大家知道，蛋白质是一个超级大的分子，它的三维结构决定了蛋白质的性质，所有的生物、人体、植物动物的细胞都由蛋白质组成。人类今天对蛋白质的理解还是非常浅的。

2017年的诺贝尔化学奖颁给了冷冻电镜的发明者Richard Henderson，冷冻电镜是干什么的呢？用来看蛋白质的三维结构。过去人类不知道，也无法看到蛋白质的三维结构，现在有了冷冻电镜，我们终于可以看到蛋白质的三维结构。怎么看呢？要把细胞冷冻了以后，照几十万张照片才能画出一个蛋白质的三维结构。所以，只要看清楚一个蛋白质的三维结构，那就是顶级期刊的一篇文章。

阿法蝶（叠）从基因序列准确预测蛋白质结构

那么一台冷冻电镜多少钱呢？一千万美金。我们去耶鲁，耶鲁人非常骄傲：我们有一台电镜。清华有两台。但是今天，“阿尔法折叠”只用人工智能就可以把它猜出来。怎么猜出来的？不知道。这就带来了一个巨大的问题：阿尔法狗下围棋，谷歌的工程师并不知道他怎么下，聂卫平也不知道。人工智能里出现了一个巨大的问题，就是不可解释性。

林永青：作为开场白，有一点明显的感触就是，相比较2016年阿法狗战胜人类围棋冠军的时候，今天业界的专家包括维嘉学长在内的业界专家，人们在情绪上更为乐观了，或许这两年大家更多地发现“人工智能”的局限性，更多地自我认同了人类的种种核心或独特优势。

我倾向于用“维度”来解释人类知识或人类认知。由于人类自身“生物熵”的局限性，我的“猜测”（卡尔-波普尔的知识论术语）是人类最多只能处理三个维度的信息（知识）。因此，人类认识论的哲学争论，也只不过停留在“一元论”与“二元论”这个非常可怜的层级。

什么是“维度”？就是“思维”的维度。维度问题离不开“时间”因素——今天多数人的“时空观”，只能理解到三维空间加上第四维时间——加上了时间维度，人们大致可以在认知上处理多维的，；但是，在“同时或共时”的约束下，人们。机器智能的区别就是维度区别。

爱因斯坦有句名言：想像力比知识更重要。不是吗？我们的知识，只是二维（最多三维）的因果或相关连接，而多维的想像力，就是我们一无所知的暗知识。

我有一个“猜想”，所谓“解释”，就是为知识建立某一角度（同一维度）或某一维度的“连接”。黑格尔很早就验证了“因果链”在逻辑上是苍白的，只是归纳法的运用而已，所以，我认为解释也不过是一种类比或隐喻，既不是演绎推理，也不是统计归纳，因此“解释”也就是一种意识连接、一种“无法解释”的暗知识“涌现”。

｛延伸解读｝波普尔：《猜想与反驳：科学知识的增长》

人类目前对于人工智能及人类智能的相关知识，都还只是非常早期的“猜想”。需要长期的验证或反驳，来进行证实或证伪。

《猜想与反驳：科学知识的增长》，是英国哲学家卡尔-波普尔创作的哲学著作，首次出版于1963年。

该书是由波普尔不同时期的文章和讲演组成的，除导论《论知识和无知的来源》外，分“猜想”和“反驳”两部分。围绕着知识通过猜想与反驳，不断清除错误而增长这一主题展开论述，广泛涉猎知识论、科学论、真理论，以及自然科学史和社会科学史等领域。

阐述了其批判理性主义方法论的主要著作，认为科学开始于问题，即理论由证伪暴露出问题；从灵感出发，提出各种大胆的猜测，形成科学理论，然后对各种理论进行检验，从观察和实验中达到逼真度较高的新理论。新理论为科学技术的发展所证伪，又出现新问题。

波普指出，古典的经验主义和理性主义都是错误的，无论观察还是理性都不是知识的源泉。因为“我们的知识有各种各样的源泉；至今没有一种源泉有权威性。”

真正的认识论问题不是关于知识源泉问题，而是知识的正确性、即是否同事实相一致的问题。知识的进步在于批判地考察那些大胆的猜想。波普从哲学史和科学史的大量材料出发，全面的阐述了他的科学哲学思想，并在此基础上提出了科学发现的方法，即猜想—反驳方法论。

价值中国：“暗知识”的提出，相信对于人类的认识论哲学，又推进了一步。请对此问题做些解读。

王维嘉：我们人类从来没有这样憋屈过，因为我们自以为是整个宇宙智能最高的生物，没有任何事情是我们不可理解的，所有的事情都应该有因果。可是为什么到了今天，我们居然不能理解？这就让我们回到人类是如何获取知识的这个问题。

过去两千年来，一直有两派在激烈地争论。一派是理性主义。他们认为，概念是天生就有的，知识来自于推理，万事万物都有因果。这派的代表有柏拉图，一直到笛卡尔。另外一派是从亚里士多德到苏格兰学派，他们认为人生出来天生是白纸一张，知识来自于感官，来自于经验，万世万物没有什么因果，只是相关。我们中国人更倾向于哪一派呢？经验主义。中国人觉得，所有的经验不通过感受和感官怎么能得到呢？

经验主义的一个重要的方法论叫“归纳”。我见到一只天鹅是白的，两只天鹅是白的……第一万只天鹅是白的，那么我就得出结论——天鹅是白的，直到出现了第一只黑天鹅。所以，归纳法也是错的，是不可靠的。

简单做个小结。理性主义和经验主义的历史争论，对于知识的进步基本无用。比如，理性主义对于人类从上帝手中解放自己，所谓“祛魅”有一些作用，对后人理解知识，却没有什么用处。经验主义的出发点，也只是为了阻击理性入侵宗教或道德等“形而上”领域，对理解“客观知识”也几乎无用。包括近代最重要的哲学家康德，在知识论上，我也认为是贡献甚微。

但是，我们现在在脑神经科学等领域取得一点点进展，这可能帮助我们在微观上理解知识有所助益；而在宏观上，需要哲学来对知识做出整体性把握，方法是通过重新解释由“科学带来的真实性论据”。

价值中国：理性主义和经验主义争论了上千年，实质上并没有什么知识进步。那么从今天的科学成果来解释，人类的获取知识的机制是什么？

王维嘉：为什么这两派争了两千年，谁都不服谁？原因是他们在瞎争，因为他们都不理解人类学习的微观机制是什么样的。人类学习的微观机制一直到70年前才开始被搞清，它就基于大脑神经元的连接。人类有860亿个神经元。

这个学习机制是怎么发现的？我们要归功于巴甫洛夫。他发现，给狗喂食的时候摇铃，一旦形成了习惯，即使没有食物，一摇铃狗也会流口水。这就是条件反射。1949年，加拿大科学家赫布就如何解释这个现象提出了一个猜想：同时受激发的两个神经元会连接起来。比如，嗅觉细胞闻到了狗食的香味，同时听觉细胞听到了铃声，这两个细胞是同时受刺激的，一旦同时受刺激，它俩就连起来了，在连接的地方就形成了学习。下一回当你只听到铃声，这个细胞就被激活，就会刺激“口水”细胞。这一猜想后来被无数的科学实验证明是对的，被称为“赫布学习定律”。

人类所有的学习都是这样的一个微观机制。再微观下去，每个神经有上千个突触，每个突触之间是有电流通过的，所谓神经元之间的连接，实际是离子变成了电流，然后建立了神经元之间的传导，其中的间隙只有20纳米。知道了学习的微观机制，我们就可以回过头来看人类的知识是怎么获得的。

价值中国：请对所定义的不同种类的知识，做一介绍。

王维嘉：我们今天理解的知识叫“明知识”，就是可以用文字、公式、程序、语言表达出来的知识。直到70年前，波兰尼、哈耶克发现了一种知识叫“默知识”，或者叫“默会知识”。比如学自行车，全世界没有一个人骑自行车是看手册学会的，都是骑上去歪歪扭扭摔几跤学会的。你教孩子学自行车，其实你也不知道是怎么学的。这种知识在生活中大量存在，比如绘画、舞蹈和拉提琴等等都是这样的默会知识。默会知识的基本原理就是：大脑神经元建立了联系，但这样的联系非常复杂，是无法用语言表达的。我们所有的重大决定，最后都是由老板拍板。老板怎么拍板？索罗斯说，“我所有的重大决定都是靠胃做出来的，如果我的胃疼，说明这个决定不好。”

比如说，乔布斯从来不做市场调查，他说，“我的市场调查，就是每天早上出门前对着镜子看我自己。”为什么？当智能手机出来之前，你去做用户调查，问：你认为一个智能手机是什么样的？你想要什么样的智能手机？全世界没有一个人说得出来，这就是默知识，我们冥冥中知道要什么东西，但是说不出来。那怎么办？只能靠企业家去试错，在乔布斯成功之前，硅谷试了20年，从掌上电脑到不成功的手机和触屏，出现了各种各样的东西，有不知道多少家公司失败，最后到乔布斯成功。所以，因为默知识不可集中，所以创新必须是分散的，永远不可集中。

讲完了明知识和默知识，我们现在就可以讲机器发现的暗知识。什么叫暗知识？就是人类不可感受又不可表达的一类新知识。我们如果划一个坐标轴，横轴是可表达，纵轴是可感受，那我们会发现，人类已有的知识都在右边，有浮力定律等即可感受、也可表达的明知识；还有集合论、广义相对论、量子力学等可表达而不可感受的明知识，它们是从方程里推出来的，是先有数学而后才有的物理发现。默知识是不可表达，但是可感受。这四个象限正好缺了第四象限，就是既不可表达又不可感受，这就是今天机器发现的这类知识，也就是阿尔法狗下围棋、“阿尔法折叠”算蛋白质三维结构的这类知识。

（来源于价值中国网）