全书导航
大模型之路:从图灵、感知机到 ChatGPT · 卷 1

第 1 章:图灵的问题:机器会思考吗?

本章问题:机器能不能表现得像人在思考?


1.1 一个无法回答的问题

1950 年,艾伦·图灵提了一个看起来简单的问题:

机器会思考吗?

麻烦在于,每个词都不安分。

什么是"机器"?是一台转动齿轮的装置,还是任何能处理信息的系统?什么是"思考"?是做数学题,是理解语言,是拥有意识,还是只要表现得足够聪明?

如果一上来就纠缠定义,讨论立刻变成哲学泥潭。每个人都可以提出自己的定义,谁也说服不了谁。

图灵聪明的地方在于:他没有硬给"思考"下定义。他换了一个问题——

如果我们只能通过文字和一个对象交流,而我们分不清对方是人还是机器,那这台机器是否已经在某种意义上表现出了智能?

这就是后来被称为"图灵测试"的思想来源。

它的高明之处不在于彻底解决了"智能是什么",而在于把一个抽象问题改造成了一个可观察的行为问题。"思考"太难定义;"表现得像在思考"则可以被测试。这一步非常关键——人工智能后来几十年的历史,几乎都在这条缝隙里展开:机器不一定像人一样思考,但它可以越来越像人一样完成任务。


1.2 为什么是文字

为什么是文字?

这不只是技术限制(1950 年的计算机只能打字),更是文明的选择。人类几千年的知识——从苏美尔泥板到印刷机——都以文字为载体。西方哲学传统从亚里士多德到罗素,一直试图把思考还原为可操作的语言命题。图灵成长在这个传统里,用文字对话来测试智能对他而言是呼吸般自然的事。更深一层说,语言不只是交流工具——我们通过说话和写作来推理、规划、反思。从语言入手,直接切入了认知的核心机制,而不是外围的感知或运动。

文字也恰到好处地"窄"和"宽"。它窄到剥离了外貌、声音、动作这些物理干扰,让早期计算机理论可以进入讨论;又宽到足以承载推理、幽默、知识和上下文。这也是为什么大语言模型后来能成为人工智能史上的特殊事件——它们没有先学会走路,而是先学会了生成像人类语言的文本。ChatGPT 出现在输入框里,而不是以机器人的形象敲门,图灵在 1950 年就直觉地预演了这个场景。


1.3 行为主义的智慧与代价

图灵把问题从"机器有没有智能"转向"机器能不能在对话中表现得像人",这让 AI 研究获得了一个工程化入口。但它也埋下了一个长期争议。

如果机器只是表现得像人在思考,这够吗?一个大语言模型解释一首诗——它是在理解诗,还是在生成关于诗的高概率文本?它解一道数学题——是在推理,还是在模仿训练数据中见过的推理形式?

图灵测试不是一个终极标准。它更像一个思想实验,一个让问题变得可讨论的入口。一个机器可能通过某种形式的对话测试,却在真实世界任务中很脆弱。反过来,一个机器也可能非常智能,却不擅长模仿人类说话——一个蛋白质结构预测模型对生物学极其有用,但它不会聊天。

所以"像人"不是智能的唯一形式。

但换个角度看,人类判断他人智能时,本来也主要依赖行为。你说出一句话,我无法直接看到你的意识。我只能根据你的表达、行动、反应,判断你是否理解了某件事。对机器也一样——我们观察的是行为:它能不能回答问题,能不能修正错误,能不能举一反三。

图灵留下的真正遗产,不是一个万能考卷,而是一种转换问题的方式:不要空谈智能的本质,先观察系统能做什么。 今天评估大模型也应该如此。与其纠缠"它到底有没有意识",不如问:它在哪些任务上可靠?在哪些情境下会出错?它能不能在真实工作流中产生价值?这些问题比一句"它是不是智能"有用得多。



1.4 本章结语:一个问题打开的时代

图灵没有发明大模型,他甚至没见过今天意义上的人工智能系统。但他提出的问题,像一颗种子埋进了后来所有 AI 研究的土壤里。

机器能不能思考?如果不能,它为什么表现得越来越像在思考?如果能,这种思考和人类思考有什么不同?

这些问题不会在第一章得到最终答案。整本书都将围绕它们展开。

下一章,我们会来到 1956 年的夏天。在达特茅斯学院,一群年轻的研究者聚在一起。他们相信,只要给他们一些时间,就能让机器拥有学习、推理和创造的能力。他们给这个野心起了一个名字:人工智能。而那是一个新领域的诞生,也是一次巨大乐观主义的开始。


text
问题:机器会思考吗?方法:图灵把"思考"问题转化为可观察的语言行为问题。突破:让机器智能从哲学争论进入可测试、可工程化的讨论。局限:像人说话不等于真正理解,图灵测试也不是智能的终极标准。今天:ChatGPT 让图灵的问题重新进入大众生活,但我们需要用更丰富的标准评估大模型。
SECTION §02 · ENGAGE

Discussion

留言区 · GitHub-powered comments via Giscus