全书导航
大模型之路:从图灵、感知机到 ChatGPT · 卷 1

第 2 章:达特茅斯之夏:人工智能的诞生

本章问题:人工智能为什么会成为一个独立研究领域?


2.1 一个夏天,一个新名字

1956 年夏天,美国新罕布什尔州汉诺威小镇。

达特茅斯学院的校园安静、明亮、带着典型的新英格兰气息。树影落在草地上,年轻的研究者们带着一股战后科学时代特有的乐观聚在一起。他们不是来讨论一门已经成熟的学科,而是来给一个尚未真正成形的梦想命名。

他们相信,机器不应该只会计算数字。

机器也许可以学习。

可以推理。

可以使用语言。

可以形成概念。

可以解决那些过去被认为只有人类才能解决的问题。

这次会议后来被称为“达特茅斯会议”。它经常被视为人工智能作为一个研究领域正式诞生的时刻。

但这件事真正重要的地方,不只是几位科学家在一个夏天开了一场会。

真正重要的是,他们给一个野心勃勃的想法起了一个名字:

Artificial Intelligence。

人工智能。

名字很重要。

在一个领域被命名之前,相关想法可能散落在数学、逻辑、神经科学、控制论、心理学、语言学和工程学之中。有人研究自动机,有人研究神经元模型,有人研究博弈,有人研究逻辑证明,有人研究计算机程序。

它们像许多尚未连成星座的星星。

而“人工智能”这个名字,把这些星星连在了一起。

从此以后,人们可以说:我们研究的是同一个大问题。

这个大问题就是:

能不能让机器表现出通常需要人类智能才能完成的能力?

这是一个极其大胆的问题。

大胆到今天回看,仍然能感觉到那种近乎冒险的气味。

因为当时的计算机还非常原始。它们笨重、昂贵、缓慢,远没有今天手机里的芯片强大。没有互联网,没有海量数据,没有 GPU,也没有深度学习框架。

但早期人工智能研究者并不缺少信心。

他们缺少的是机器。

不缺的是想象力。


2.2 为什么是 1956 年?

一个领域的诞生,通常不是因为某一天突然出现了一个全新的想法。

更多时候,是很多条件终于凑到了一起。

人工智能也是如此。

在 1956 年之前,几个关键思想已经准备好了。

第一,计算机已经出现。

这让“机器执行复杂规则”不再只是哲学幻想,而变成了工程现实。早期计算机首先用于数值计算,但它们的本质并不只是算数。只要把信息编码成符号,机器就可以按照规则操作这些符号。

第二,图灵已经把“机器能否思考”变成了一个可以讨论的问题。

上一章我们说过,图灵没有死磕“思考”的本质定义,而是把问题转向可观察的行为。这个转向很关键:它让研究者可以暂时绕开哲学争论,先制造能表现出智能行为的系统。

第三,神经科学、控制论和信息论正在改变人们对大脑和机器的看法。

如果大脑可以被看作一个信息处理系统,那么机器是否也能以某种方式处理信息、学习模式、产生判断?

第四,战后科学共同体充满了技术乐观主义。

雷达、密码破译、原子能、早期计算机都在证明:那些曾经看起来不可思议的事情,可以通过数学、工程和组织化科研变成现实。

于是,一个时代性的信念出现了:

既然机器可以帮助人类计算,那么它为什么不能帮助人类思考?

达特茅斯会议就是在这样的背景中发生的。

它不是凭空出现的闪电。

它更像一场聚焦。

许多分散的光线,被一个新名字聚到了一起。


2.3 他们到底想做什么?

达特茅斯会议的野心,放到今天读起来仍然很惊人。

他们想研究的不是一个小工具,也不是某个窄任务。

他们关心的是:

  • 机器如何使用语言;
  • 机器如何形成抽象概念;
  • 机器如何解决问题;
  • 机器如何自我改进;
  • 机器如何进行学习;
  • 机器如何模拟人类智能的不同方面。

也就是说,从一开始,人工智能就不是一个“小学科”。

它的胃口非常大。

它试图把人类最骄傲的能力变成工程对象。

这就是人工智能和许多普通软件工程任务的区别。

如果你写一个工资计算程序,问题很清楚:输入员工工时、薪资规则、税率,输出工资单。

如果你写一个排序程序,问题也很清楚:给定一组数据,按某种规则排列。

但如果你说:我要制造智能。

问题马上变得模糊。

什么是智能?

下棋算智能吗?

证明定理算智能吗?

翻译语言算智能吗?

学习新概念算智能吗?

人工智能从诞生开始,就带着这种尴尬:它研究的是一个人人都觉得存在、但很难精确定义的东西。

这也是为什么 AI 史会反复出现“乐观—失望—再乐观—再失望”的循环。

因为每当机器完成了一个过去被认为需要智能的任务,人们就会重新调整对智能的定义。

机器会下棋了?

那可能只是搜索。

机器会识别图片了?

那可能只是统计模式。

机器会聊天了?

那可能只是预测下一个词。

这有时被称为“AI 效应”:一旦某个任务被机器解决,人们就不再把它看作真正的智能。

这并不一定是坏事。

它说明“智能”这个词本身就像地平线。你朝它走,它也跟着后退。

达特茅斯会议最重要的贡献,不是一次性定义了智能,而是让一群人开始系统地追逐这条地平线。


2.4 早期 AI 的第一种信仰:智能可以被形式化

达特茅斯会议之后,早期人工智能很快形成了一种强大的信念:

智能可以被形式化。

这句话听起来有点抽象,我们换个说法:

如果人类解决问题时遵循某些规则,那么机器也可以执行这些规则。

比如下棋。

棋盘状态可以表示成符号。

合法走法可以写成规则。

胜负条件可以明确判断。

如果机器能够搜索未来可能的走法,并选择看起来最好的那一步,它就能表现出某种“会下棋”的能力。

再比如证明数学定理。

公理可以写成符号。

推理规则可以写成步骤。

结论可以从前提中推导出来。

如果机器能按照逻辑规则一步步推导,它就能表现出某种“会推理”的能力。

这种思路非常自然。

因为早期计算机最擅长的事情,就是按照明确规则操作符号。

于是早期 AI 研究者很容易相信:

只要我们找到足够好的表示方式和推理规则,智能就可以被编程出来。

这条路线后来被称为符号主义人工智能。

符号主义并不是愚蠢的旧路。

相反,它非常聪明,也非常优雅。

它抓住了人类智能中很重要的一部分:我们确实会使用符号,会讲逻辑,会做计划,会把世界切分成概念,会用规则进行推理。

当你说“所有人都会死,苏格拉底是人,所以苏格拉底会死”时,你就在进行符号推理。

当你说“如果下雨,我就带伞;现在下雨了,所以我要带伞”时,你也在进行规则推理。

问题在于,人类智能不只有这一部分。

现实世界不像棋盘那么干净。

语言不像数学公理那么稳定。

常识不像逻辑规则那么容易写清楚。

而这些问题,要到后面才会真正暴露出来。

在 1950s 和 1960s,空气里更多的是乐观。


2.5 早期 AI 的第二种信仰:智能可以被分解

除了“智能可以被形式化”,早期 AI 还有另一种信念:

智能可以被分解成许多较小的能力。

这同样很自然。

如果“制造一个完整智能体”太难,那就先拆开。

让机器下棋。

让机器证明定理。

让机器玩井字棋。

让机器解决代数题。

让机器理解简单句子。

让机器规划积木世界里的动作。

每一个任务,都是智能的一小块切片。

这种做法有点像研究飞行。

你不一定一开始就造出一只真正的鸟。你可以先研究空气动力学,研究机翼,研究发动机,研究控制系统。最后,飞机并不需要像鸟一样扇翅膀,也能飞起来。

人工智能也可能如此。

机器不一定要像人脑一样工作,才可以表现出智能。

这条思路很重要,因为它让 AI 从“模拟人类”转向“实现功能”。

也就是说,人工智能未必需要复制人脑。

它可以用完全不同的方法,完成某些需要智能的任务。

这也是今天理解大模型时必须记住的一点。

大语言模型不需要像人脑一样存储知识、理解语言和产生回答。它可以用神经网络、参数、向量、概率分布和预测目标,走出一条完全不同的路线。

结果可能很像人类语言。

机制却不一定像人类心智。

这个差异,会贯穿整本书。


2.6 早期成功:机器开始解决“小世界”问题

早期 AI 并不是一开始就失败。

恰恰相反,它曾经非常令人兴奋。

研究者们很快做出了一些看起来很聪明的程序。

有的程序可以证明逻辑定理。

有的程序可以下棋。

有的程序可以解决代数问题。

有的程序可以在一个简化的积木世界里理解命令并规划动作。

这些成果让人相信:智能也许真的可以被逐步拆解、编程和扩展。

但这里有一个关键词:

小世界。

所谓小世界,是指那些边界清晰、规则明确、对象有限的环境。

棋盘是小世界。

形式逻辑是小世界。

简单代数题是小世界。

积木世界也是小世界。

在小世界里,机器非常适合发挥。

因为对象可以被枚举,规则可以被写清楚,目标可以被定义,成功和失败可以被判断。

但真实世界不是小世界。

真实世界里,物体有模糊边界。

语言充满歧义。

人的意图会变化。

常识很难穷尽。

信息经常不完整。

规则之间会互相冲突。

例外比规则还多。

你可以告诉一个孩子:“不要把牛奶倒在桌子上。”

孩子大概明白这句话在各种情境中的意思。

但如果你要把这条常识写成机器规则,你会很快陷入麻烦。

什么是倒?

什么是桌子?

如果桌子上有杯子呢?

如果是在擦桌子呢?

如果牛奶已经坏了呢?

如果这是一个魔术表演呢?

现实世界的麻烦就在这里:它总能找到规则没有覆盖到的缝隙。

早期 AI 的成功,很多都发生在小世界里。后来的困难,则来自把这些方法推广到大世界。

但从“演示成功”到“普遍可靠”,中间隔着一条很深的峡谷。人工智能的早期历史,就是不断发现这条峡谷的历史。

这对今天的大模型也有警示意义:当我们看到一个模型写诗、写代码、通过考试,很容易感到通用智能近在眼前。也许是。但也可能还有很多峡谷没有跨过去。

历史不会简单重复,但它经常押韵。


2.7 名字的遗产

“人工智能”不是一个谦虚的名字。它直接把机器和人类最珍视的能力放在一起,这让它从诞生开始就充满争议——有人兴奋,有人反感,有人担心。

但也正因为它不谦虚,才吸引了一代又一代研究者进入这个领域。有时候,一个领域需要一个足够大的名字,才能容纳足够大的野心。

而这个名字也解释了为什么 AI 从来不只是技术话题——一个排序算法不会让大众讨论”人类还剩下什么”,但一个能写文章、编程、对话的系统会。这个特点,从命名那一刻就已经埋下了。


2.8 本章地图

text
问题:人工智能为什么会成为一个独立研究领域?方法:达特茅斯会议把分散在计算、逻辑、控制论、神经科学和心理学中的问题聚合到“人工智能”这个名字下。突破:机器不再只是计算工具,而被想象成可以学习、推理、使用语言和解决问题的智能系统。局限:早期研究者低估了真实世界、常识、感知和语言的复杂性。今天:大模型仍然继承了早期 AI 对通用智能的野心,只是从规则和符号路线转向了数据、神经网络和规模化路线。

2.9 本章结语:乐观主义的第一束火

达特茅斯会议没有制造出智能机器。

它制造出的是一个领域。

这件事也许更重要。

因为一个领域一旦诞生,就会吸引资金、人才、论文、争论、实验、失败和新的想象。它会形成自己的问题清单,自己的英雄故事,自己的路线之争,也会形成自己的神话和幻觉。

人工智能从一开始就带着巨大的乐观主义。

这种乐观主义推动了研究,也制造了后来的失望。

接下来,我们会看到另一条路线登场。

如果符号主义者相信智能可以被写成规则,那么另一群人则相信:机器也许可以像大脑一样,从经验中学习。

这条路线最早的明星,叫做感知机。

它曾让媒体相信,机器可能很快会走路、说话、看见、写作,甚至意识到自己的存在。

然后,它又几乎被判了死刑。

下一章,我们讲它的诞生。

SECTION §02 · ENGAGE

Discussion

留言区 · GitHub-powered comments via Giscus