第 5 章:符号主义:把智能写成规则
本章问题:如果我们把知识写成规则,机器是不是就有智能?
5.1 另一条路
1956 年夏天——在达特茅斯会议上——艾伦·纽厄尔和赫伯特·西蒙展示了一个程序。
这个程序叫"逻辑理论家"。它能够证明伯特兰·罗素《数学原理》中的数学定理。在它的 52 个证明中,有 38 个和罗素原书一致——但它对定理 2.85 给出了一个比罗素更简短的证明。
当纽厄尔和西蒙把这个更优雅的证明提交给《符号逻辑杂志》时,编辑拒绝了它——因为作者栏里有一位"逻辑理论家",而它不是人类。
这也是人工智能史上第一个由机器发现、但被学术期刊拒绝的证明。
"逻辑理论家"不是从数据中学习的。它没有神经网络,没有权重,没有错误调整。它的工作方式是:把逻辑命题写成符号,把推理规则写成操作,然后在可能的证明路径中搜索,直到找到一条从前提通向结论的路。
这就是符号主义的核心思想:智能可以被理解为对符号的操作。
如果用一句话概括符号主义和连接主义(神经网络路线)的差别,那就是:
- 连接主义说:给机器很多例子,让它自己找规律。
- 符号主义说:把世界的规则写清楚,机器按规则执行。
这两条路线在 1956 年几乎同时起步。但在感知机被冷落之后,符号主义成为了人工智能二十年的主流。
5.2 符号:思想的原子
符号主义背后的直觉非常朴素。
当你思考"如果下雨,我就带伞"时,你的大脑里发生了什么?符号主义的答案是:你的大脑在操作符号。"下雨"是一个符号,"带伞"是一个符号,"如果……就……"是一条推理规则。你把符号按规则组合,得出了结论。
这种观察其实反映了人类思维的一个重要特征:我们确实会用符号进行推理。
数学是用符号进行的——x、y、f(x)、∫、Σ 都是符号。
逻辑是用符号进行的——A、B、A→B、¬A 都是符号。
语言本身就是一个巨大的符号系统——每个词都是一个符号,语法是组合规则,句子是符号的排列。
既然人类能用符号思考,机器为什么不能?
符号主义者相信:只要把知识编码成符号,把推理编码成形式规则,机器就能表现出智能。而且这种方式有一个神经网络没有的优势——机器的推理过程是透明的。你可以追踪它为什么得出这个结论,因为它走过的每一步都是一条明确的符号操作。
这就像做一道代数题。你写下每一步推导:3x + 2 = 8 → 3x = 6 → x = 2。每一步都有理有据。符号主义希望的,就是把所有智能行为都变成这种有理有据的推导链。
5.3 物理符号系统假说
1975 年,纽厄尔和西蒙把这个直觉提炼成了一个正式的主张:
物理符号系统具有必要且充分的手段来实现一般智能行为。
这句话在 AI 史上被称为"物理符号系统假说"。拆开来说就是两层意思:
第一,必要性:如果某个系统要表现出智能,它必须能够操作符号。没有符号,就没有智能。
第二,充分性:只要一个系统能够操作符号——表示它们、组合它们、按照规则变换它们——它就具备了实现智能的条件。不需要模拟大脑,不需要神经元,不需要学习。只需要符号和规则。
这是一个非常强的断言,也十分优雅。它给了符号主义研究者一个清晰的行动纲领:
- 找出某个智能任务涉及哪些知识;
- 把这些知识写成符号和规则;
- 让机器按照规则操作符号。
如果智能真的就是这样工作的,那么剩下的就是工程问题:把足够多的知识写进机器,机器就变聪明了。
这个假说驱动了二十年的人工智能研究。
5.4 搜索:智能的引擎
如果智能的本质是操作符号,那么具体怎么操作?
答案之一是搜索。
假设你面前有一个迷宫。你不知道出口在哪里,但你知道每一步可以往哪些方向走,也知道什么算"到达出口"。你可以尝试不同的路径:走几步,碰壁了,退回来,换一个方向。这个过程就是搜索。
符号主义把很多智能问题都看作搜索问题。
下棋?搜索:从当前局面出发,尝试走子,评估局势,选择最好的走法。
证明定理?搜索:从已知公理出发,尝试应用推理规则,直到推导出目标结论。
路径规划?搜索:从起点出发,尝试不同的动作序列,直到找到通向目标的路径。
这就引出了符号主义的一个重要概念:问题空间。任何智能问题,都可以表示为一个包含初始状态、目标状态、以及从初始到目标之间所有可能操作的"空间"。解决问题,就是在这个空间中找到一条从初始到目标的路径。
问题空间的优雅之处在于:它是通用的。不管是下棋、证明定理还是规划旅行路线,都可以套进同一个框架。你只需要改变状态的表示方式和允许的操作规则,搜索的机理不变。
这也是早期 AI 乐观主义的来源之一。如果智能真的只是搜索问题空间,那机器确实可能解决很多问题——只要你把问题定义清楚,让机器去搜就行了。
5.5 知识表示:把世界写进机器
符号主义的另一个核心问题是:知识如何表示?
如果智能行为依赖于知识,那么知识必须以某种形式存储在机器里。而且这种形式不能是"一堆文字"——必须是可以被程序操作的符号结构。
早期研究者发明了很多种知识表示方法。
逻辑表示是最简单的一种:知识就是逻辑命题。比如"所有人都会死"写成 ∀x Human(x) → Mortal(x),"苏格拉底是人"写成 Human(Socrates),然后机器可以推导出 Mortal(Socrates)。
语义网络把知识组织成节点和连线——每个节点是一个概念,每条连线是一种关系。"鸟会飞"是一个连线,"企鹅是鸟"是另一个连线,但"企鹅不会飞"又是一个例外。语义网络很直观,但很快就会遇到例外管理的麻烦。
框架是一种更有结构的方式。每个"框架"描述一类事物,有一系列"槽"来存放这个事物的属性。比如"餐厅"框架有"菜系""价格""位置""评分"等槽。遇到一家具体的餐厅,就把具体值填进去。
产生式规则是最接近日常思维的表示方式——大量的"如果……那么……"规则。如果病人发烧且白细胞升高,那么考虑感染。如果感染且咳嗽,那么考虑呼吸道感染。专家系统使用的就是这种表示(我们会在下一章详细讲)。
知识表示的核心挑战不是"如何写下一个事实",而是"如何写下所有相关的事实,并且让机器在有新信息时能更新,在有矛盾时能裁决,在有例外时能处理"。
事实证明,这个挑战比任何人预想的都难。
5.6 小世界的成功与大世界的麻烦
符号主义在某些领域非常成功。
1960 年代到 1970 年代,研究者们造出了一批令人印象深刻的系统。有的能在棋盘上击败人类业余选手。有的能在积木世界里理解"把红色方块放到蓝色方块上面"这样的指令并执行。有的能解决大学一年级的微积分题。
但这些成功有一个共同特征:它们都发生在小世界里。
棋盘是一个小世界:64 个格子,有限的合法走法,明确的胜负条件。积木世界是一个小世界:几个方块的桌面,有限的动作,明确的目标。微积分是一个小世界:定义良好的运算符,固定的变换规则,清楚的答案形式。
在小世界里,符号主义的逻辑是完整的——你可以枚举状态、写清规则、定义目标、评估结果。机器可以稳定地搜索和推理。
但真实世界不是这样的。
真实世界里,同样的句子在不同语境下意思完全不同。"给我订一张去北京的票"——是飞机票还是火车票?是今天的还是下周的?是经济舱还是商务舱?人类依靠大量常识来填补这些空白,但机器没有这些常识。
把常识写进机器,就成了一个噩梦。
一个成年人大概知道几万到几十万条常识。"水会往下流""鸟会飞但企鹅不会""如果一个人摔倒了他可能会受伤""餐厅里应该先坐下再看菜单""如果外面下雨,地面是湿的"。这些常识彼此纠缠,相互依赖,经常有例外,还随着情境变化。
每一条常识都可以写成一条规则。但当你写了上万条规则后,规则之间开始互相打架。例外多到你需要例外来管理例外。"鸟会飞,但企鹅不会,但受伤的企鹅可以被飞机运,但被飞机运并不意味着它会飞……"这类推理链在人脑里瞬间完成,在规则系统里却可能陷入无尽的逻辑冲突。
这就是符号主义遇到的核心瓶颈:知识获取问题——人把知识写进机器太慢了、太贵了、太容易出错了。
你可以写一百条规则做一个原型。但要处理真实世界的多样性和例外,你需要一万条、十万条。每条新规则可能和已有的规则冲突。调试一个几千条规则的系统,就像在没有地图的沼泽里找路。
在这个时期,研究者们逐渐意识到一个残酷的不等式:一个领域专家花几秒钟就能做出的判断,写成机器规则可能需要几天;而一个普通人日常生活中不经意间用到的常识,如果全写成规则,可能需要几万条。
5.7 本章小实验:用规则来"思考"
你可以自己体验一下写规则的乐趣和痛苦。
假设你要写一组规则,帮机器判断一封信是不是垃圾邮件。先不用机器学习——用你聪明的大脑,写下"如果……那么……"的规则。
想一想:
- 信里出现哪些词会增加垃圾邮件的嫌疑?
- 哪些词会减弱这个嫌疑?
- 如果一封信同时有"垃圾词"和"正常词",怎么判断?
- 如果发件人是你认识的人,规则要不要变?
- 如果信里提到了你的真实名字,规则要不要变?
先写出 5 条规则。然后找 3 封真实的邮件——两封正常邮件和一封垃圾邮件(或者自己设计三封假邮件)。用你的规则去判断。
你会发现两件事:
第一,5 条规则远远不够。你会漏掉很多情况。
第二,即使你增加到 20 条,仍然会有邮件让规则左右为难——比如看起来像正常邮件但其实不是,或者看起来是垃圾但其实很重要。
这就是规则系统的根本困境:规则永远追不上现实的复杂度。
而机器学习的做法完全不同——它不写规则。它只看几千封标注好的"垃圾"和"正常"邮件,自己找出在垃圾邮件中频繁出现但在正常邮件中不常见的模式。至于这些模式"为什么"意味着垃圾?机器学习不告诉你。(至少,在那个年代不告诉你。)
两种思路各有长短。但在 1960 到 1980 年代,符号主义是主流——不是因为它完美,而是因为它能工作,而且没有更好的替代方案。
5.8 本章地图
5.9 本章结语:规则的优雅与尴尬
符号主义是一个优雅到令人遗憾的研究纲领。
它优雅,因为它抓住了人类智能中真正重要的一部分:我们确实会使用逻辑,会操作符号,会把复杂问题分解成一步步可验证的推理。在这些方面,符号主义的分析方法一点也不愚蠢。
它遗憾,因为现实世界拒绝被彻底形式化。语言、常识、感知、类比、情绪、语境——这些东西像水银一样,被符号的网格一碰就散开。规则越多,系统越脆弱;例外越多,逻辑越无力。
这个矛盾不是偶然的。它指向一个更深层的问题:或许智能的核心并不在于"拥有正确的规则",而在于"知道什么时候该用什么规则"——而后者本身很难用规则来表述。
在接下来的章节中,我们会看到符号主义在工程上最成功的形态——专家系统——如何把"写规则"变成一个产业。然后,我们会看到这个产业如何在泡沫中膨胀,又如何在现实中破裂。
再然后,神经网络的种子会重新发芽。
但在此之前,我们还需要看清楚:为什么写规则这一条路,虽然不够,但人类走了那么远才愿意承认它不够。
Discussion
留言区 · GitHub-powered comments via Giscus