全书导航

大模型之路：从图灵、感知机到 ChatGPT · 卷 1

第 5 章：符号主义：把智能写成规则

本章问题：如果我们把知识写成规则，机器是不是就有智能？

5.1 另一条路

1956 年夏天——在达特茅斯会议上——艾伦·纽厄尔和赫伯特·西蒙展示了一个程序。

这个程序叫"逻辑理论家"。它能够证明伯特兰·罗素《数学原理》中的数学定理。在它的 52 个证明中，有 38 个和罗素原书一致——但它对定理 2.85 给出了一个比罗素更简短的证明。

当纽厄尔和西蒙把这个更优雅的证明提交给《符号逻辑杂志》时，编辑拒绝了它——因为作者栏里有一位"逻辑理论家"，而它不是人类。

这也是人工智能史上第一个由机器发现、但被学术期刊拒绝的证明。

"逻辑理论家"不是从数据中学习的。它没有神经网络，没有权重，没有错误调整。它的工作方式是：把逻辑命题写成符号，把推理规则写成操作，然后在可能的证明路径中搜索，直到找到一条从前提通向结论的路。

这就是符号主义的核心思想：智能可以被理解为对符号的操作。

如果用一句话概括符号主义和连接主义（神经网络路线）的差别，那就是：

连接主义说：给机器很多例子，让它自己找规律。
符号主义说：把世界的规则写清楚，机器按规则执行。

这两条路线在 1956 年几乎同时起步。但在感知机被冷落之后，符号主义成为了人工智能二十年的主流。

5.2 符号：思想的原子

符号主义背后的直觉非常朴素。

当你思考"如果下雨，我就带伞"时，你的大脑里发生了什么？符号主义的答案是：你的大脑在操作符号。"下雨"是一个符号，"带伞"是一个符号，"如果……就……"是一条推理规则。你把符号按规则组合，得出了结论。

这种观察其实反映了人类思维的一个重要特征：我们确实会用符号进行推理。

数学是用符号进行的——x、y、f(x)、∫、Σ 都是符号。

逻辑是用符号进行的——A、B、A→B、¬A 都是符号。

语言本身就是一个巨大的符号系统——每个词都是一个符号，语法是组合规则，句子是符号的排列。

既然人类能用符号思考，机器为什么不能？

符号主义者相信：只要把知识编码成符号，把推理编码成形式规则，机器就能表现出智能。而且这种方式有一个神经网络没有的优势——机器的推理过程是透明的。你可以追踪它为什么得出这个结论，因为它走过的每一步都是一条明确的符号操作。

这就像做一道代数题。你写下每一步推导：3x + 2 = 8 → 3x = 6 → x = 2。每一步都有理有据。符号主义希望的，就是把所有智能行为都变成这种有理有据的推导链。

5.3 物理符号系统假说

1975 年，纽厄尔和西蒙把这个直觉提炼成了一个正式的主张：

物理符号系统具有必要且充分的手段来实现一般智能行为。

这句话在 AI 史上被称为"物理符号系统假说"。拆开来说就是两层意思：

第一，必要性：如果某个系统要表现出智能，它必须能够操作符号。没有符号，就没有智能。

第二，充分性：只要一个系统能够操作符号——表示它们、组合它们、按照规则变换它们——它就具备了实现智能的条件。不需要模拟大脑，不需要神经元，不需要学习。只需要符号和规则。

这是一个非常强的断言，也十分优雅。它给了符号主义研究者一个清晰的行动纲领：

找出某个智能任务涉及哪些知识；
把这些知识写成符号和规则；
让机器按照规则操作符号。

如果智能真的就是这样工作的，那么剩下的就是工程问题：把足够多的知识写进机器，机器就变聪明了。

这个假说驱动了二十年的人工智能研究。

5.4 搜索：智能的引擎

如果智能的本质是操作符号，那么具体怎么操作？

答案之一是搜索。

假设你面前有一个迷宫。你不知道出口在哪里，但你知道每一步可以往哪些方向走，也知道什么算"到达出口"。你可以尝试不同的路径：走几步，碰壁了，退回来，换一个方向。这个过程就是搜索。

符号主义把很多智能问题都看作搜索问题。

下棋？搜索：从当前局面出发，尝试走子，评估局势，选择最好的走法。

证明定理？搜索：从已知公理出发，尝试应用推理规则，直到推导出目标结论。

路径规划？搜索：从起点出发，尝试不同的动作序列，直到找到通向目标的路径。

这就引出了符号主义的一个重要概念：问题空间。任何智能问题，都可以表示为一个包含初始状态、目标状态、以及从初始到目标之间所有可能操作的"空间"。解决问题，就是在这个空间中找到一条从初始到目标的路径。

问题空间的优雅之处在于：它是通用的。不管是下棋、证明定理还是规划旅行路线，都可以套进同一个框架。你只需要改变状态的表示方式和允许的操作规则，搜索的机理不变。

这也是早期 AI 乐观主义的来源之一。如果智能真的只是搜索问题空间，那机器确实可能解决很多问题——只要你把问题定义清楚，让机器去搜就行了。

5.5 知识表示：把世界写进机器

符号主义的另一个核心问题是：知识如何表示？

如果智能行为依赖于知识，那么知识必须以某种形式存储在机器里。而且这种形式不能是"一堆文字"——必须是可以被程序操作的符号结构。

早期研究者发明了很多种知识表示方法。

逻辑表示是最简单的一种：知识就是逻辑命题。比如"所有人都会死"写成 ∀x Human(x) → Mortal(x)，"苏格拉底是人"写成 Human(Socrates)，然后机器可以推导出 Mortal(Socrates)。

语义网络把知识组织成节点和连线——每个节点是一个概念，每条连线是一种关系。"鸟会飞"是一个连线，"企鹅是鸟"是另一个连线，但"企鹅不会飞"又是一个例外。语义网络很直观，但很快就会遇到例外管理的麻烦。

框架是一种更有结构的方式。每个"框架"描述一类事物，有一系列"槽"来存放这个事物的属性。比如"餐厅"框架有"菜系""价格""位置""评分"等槽。遇到一家具体的餐厅，就把具体值填进去。

产生式规则是最接近日常思维的表示方式——大量的"如果……那么……"规则。如果病人发烧且白细胞升高，那么考虑感染。如果感染且咳嗽，那么考虑呼吸道感染。专家系统使用的就是这种表示（我们会在下一章详细讲）。

知识表示的核心挑战不是"如何写下一个事实"，而是"如何写下所有相关的事实，并且让机器在有新信息时能更新，在有矛盾时能裁决，在有例外时能处理"。

事实证明，这个挑战比任何人预想的都难。

5.6 小世界的成功与大世界的麻烦

符号主义在某些领域非常成功。

1960 年代到 1970 年代，研究者们造出了一批令人印象深刻的系统。有的能在棋盘上击败人类业余选手。有的能在积木世界里理解"把红色方块放到蓝色方块上面"这样的指令并执行。有的能解决大学一年级的微积分题。

但这些成功有一个共同特征：它们都发生在小世界里。

棋盘是一个小世界：64 个格子，有限的合法走法，明确的胜负条件。积木世界是一个小世界：几个方块的桌面，有限的动作，明确的目标。微积分是一个小世界：定义良好的运算符，固定的变换规则，清楚的答案形式。

在小世界里，符号主义的逻辑是完整的——你可以枚举状态、写清规则、定义目标、评估结果。机器可以稳定地搜索和推理。

但真实世界不是这样的。

真实世界里，同样的句子在不同语境下意思完全不同。"给我订一张去北京的票"——是飞机票还是火车票？是今天的还是下周的？是经济舱还是商务舱？人类依靠大量常识来填补这些空白，但机器没有这些常识。

把常识写进机器，就成了一个噩梦。

一个成年人大概知道几万到几十万条常识。"水会往下流""鸟会飞但企鹅不会""如果一个人摔倒了他可能会受伤""餐厅里应该先坐下再看菜单""如果外面下雨，地面是湿的"。这些常识彼此纠缠，相互依赖，经常有例外，还随着情境变化。

每一条常识都可以写成一条规则。但当你写了上万条规则后，规则之间开始互相打架。例外多到你需要例外来管理例外。"鸟会飞，但企鹅不会，但受伤的企鹅可以被飞机运，但被飞机运并不意味着它会飞……"这类推理链在人脑里瞬间完成，在规则系统里却可能陷入无尽的逻辑冲突。

这就是符号主义遇到的核心瓶颈：知识获取问题——人把知识写进机器太慢了、太贵了、太容易出错了。

你可以写一百条规则做一个原型。但要处理真实世界的多样性和例外，你需要一万条、十万条。每条新规则可能和已有的规则冲突。调试一个几千条规则的系统，就像在没有地图的沼泽里找路。

在这个时期，研究者们逐渐意识到一个残酷的不等式：一个领域专家花几秒钟就能做出的判断，写成机器规则可能需要几天；而一个普通人日常生活中不经意间用到的常识，如果全写成规则，可能需要几万条。

5.7 本章地图

text

问题：如果我们把知识写成规则，机器是不是就有智能？方法：将智能看作符号操作——把知识编码成符号，把推理写成规则，通过搜索在问题空间中寻找解。突破：在某些"小世界"问题（棋类、定理证明、积木世界）中取得了令人信服的成功。局限：真实世界太复杂，规则写不完、写不准确、互相冲突。知识获取成为瓶颈。今天：RAG、函数调用、知识图谱、工具使用——这些大模型技术在功能上呼应了符号主义的一些核心关切（如何表示知识、如何让机器按规则行动、如何让推理过程可追溯），但实现路径完全不同：底层机制仍然是神经网络从数据中学习模式，而非手工编写规则。

问题：如果我们把知识写成规则，机器是不是就有智能？方法：将智能看作符号操作——把知识编码成符号，把推理写成规则，通过搜索在问题空间中寻找解。突破：在某些"小世界"问题（棋类、定理证明、积木世界）中取得了令人信服的成功。局限：真实世界太复杂，规则写不完、写不准确、互相冲突。知识获取成为瓶颈。今天：RAG、函数调用、知识图谱、工具使用——这些大模型技术在功能上呼应了符号主义的一些核心关切（如何表示知识、如何让机器按规则行动、如何让推理过程可追溯），但实现路径完全不同：底层机制仍然是神经网络从数据中学习模式，而非手工编写规则。

5.8 本章结语：规则的优雅与尴尬

符号主义是一个优雅到令人遗憾的研究纲领。

它优雅，因为它抓住了人类智能中真正重要的一部分：我们确实会使用逻辑，会操作符号，会把复杂问题分解成一步步可验证的推理。在这些方面，符号主义的分析方法一点也不愚蠢。

它遗憾，因为现实世界拒绝被彻底形式化。语言、常识、感知、类比、情绪、语境——这些东西像水银一样，被符号的网格一碰就散开。规则越多，系统越脆弱；例外越多，逻辑越无力。

这个矛盾不是偶然的。它指向一个更深层的问题：或许智能的核心并不在于"拥有正确的规则"，而在于"知道什么时候该用什么规则"——而后者本身很难用规则来表述。

在接下来的章节中，我们会看到符号主义在工程上最成功的形态——专家系统——如何把"写规则"变成一个产业。然后，我们会看到这个产业如何在泡沫中膨胀，又如何在现实中破裂。

再然后，神经网络的种子会重新发芽。

但在此之前，我们还需要看清楚：为什么写规则这一条路，虽然不够，但人类走了那么远才愿意承认它不够。

SECTION §02 · ENGAGE

Discussion

留言区 · GitHub-powered comments via Giscus