AI是数学的胜利，不是理解的胜利，它是最强预测器，但不是思想家

你的位置：bob手机在线登录-综合客户端 > 新闻动态 >

发布日期：2025-05-21 21:51 点击次数：116

图片

老胡科学2025-04-30 23:18优质科学领域创作者

人工智能的核心，不在“智能”，而在于它其实是一台复杂的、矩阵乘法驱动的压缩与预测机器。

它的“神经网络”，不是脑神经，不生电，不会痛，它只是层层函数、堆堆参数。数十亿乃至数万亿的浮点权重，在一场场矩阵乘法中计算出下一个字、下一个图像像素、下一帧蛋白质的结构。

图片

“模型”，并不是有意识的存在，而是算法与数据的直接产物。一个模型的“推理”，不过是生成一串自洽的中间步骤，符合训练中“看起来像推理”的数据统计特征。这不是逻辑演绎，而是“看起来像”。

今天AI的能力，来自“预训练”四个字。这不是训练它完成某个任务，而是先给它喂进整个互联网。网页、维基百科、小说、论坛对话、GitHub代码……先让它什么都看。然后才来“微调”，让它听人话、写邮件、画图、下棋。

真正颠覆行业的，是“生成式AI”。这一类模型，能够从输入中生成输出，而不是仅仅分类、打标签。GPT是生成文本，DALL·E是生成图像，AlphaFold是生成蛋白质结构。背后都是一套类似的逻辑：Transformer架构。

Transformer不是一个术语，是一个分水岭。Google在2017年推出的这项结构，把所有输入都看作序列，不管是语句、图片、视频帧、还是棋盘。它不再按顺序处理数据，而是一次性关注所有位置的“上下文”，换句话说：学会“看全局”。

Transformer的革命性不在于数学多高级，而在于它兼容性太强。图像识别、语音识别、机器翻译、聊天机器人，全都能用。换句话说，它是AI界的万能接头。

而这背后跑的，其实都是同一类操作：矩阵乘法。神经网络运行的本质，就是无数个矩阵乘法叠加优化。这也解释了为什么今天的AI烧电烧得吓人，为什么英伟达靠卖GPU成为了AI军火商。能把矩阵乘法跑得快，就是通向未来的钥匙。

也正因如此，整个AI世界疯狂追求一种能力：泛化。也就是让模型在没见过的数据上依然表现得靠谱。模型不是懂，它是“猜得像”，而“猜得像”靠的是海量数据加上微妙的参数调整。

可参数再多，错也照样会犯。AI“幻觉”就是最典型的例子。它不是故意编造，它是自信地输出一个在统计上看起来合理但事实上完全错误的答案。胡编乱造的引文，都是这么来的。这不是bug，是机制本身决定的。

“强化学习”成了人类用来纠偏的方法。告诉AI什么样的答案“奖励”更高，让它学会少犯错、多听话。但别以为这是训练“逻辑”，它本质上仍然是“调参”。我们在行为上引导它，但它并不理解“为什么”。

机制可解释性（Mechanistic Interpretability）是最近几年AI研究最硬核的方向。它想要回答一个问题：我们训练出来的这些庞大网络，内部到底学了什么？有没有“电路”？有没有“概念”？有没有“模块”？这是拆机式的神经网络解剖。

研究人员开始尝试在模型内部定位“黄金门大桥”对应的神经元，逆向还原它是怎么学会这些语义的。有些甚至找到了人工构建的“推理回路”——一个个自动生成的类电路结构，确实负责某种任务。但整体仍是一座黑箱，只是“灰”得没那么彻底了。

还有一类问题更现实：数据从哪来？答案是“合成数据”。很多时候，真实世界的数据不够干净、不够全，甚至存在偏见。那怎么办？用生成模型自己生成一批新数据，再拿来训练另一个模型。这就是AI喂AI，自我繁殖。但如果过度依赖，它会陷入“模型坍缩”：学来学去，只是在模仿自己。

模型到底有没有偏见？有。而且来自数据本身。例如，“CEO”更常被生成成白人男性。这是网络数据的事实反映，也是模型训练的现实产物。要解决，不是靠政治口号，而是靠“偏见干预”：训练过程中加入偏好、限制和奖励机制，让模型向某种期望靠近。

那AI到底有没有“理解”？从“嵌入”（embeddings）说起。模型内部所有的信息都被转化为一堆浮点数，这些数之间的相对关系，就是模型的“语义空间”。“狗”离“幼犬”近，离“烤面筋”远。它不理解词义，但它在数字上“排列”得很合理。

“推理”也不是传统意义的推理。模型在“推理”时，只是在生成一个“思维链条”的文本序列。这些链条可以看起来像思考的过程，但其实只是预测下一个最合理的词而已。你说它思考，它其实在模拟思考的形式。

而整个AI系统的前提，是一次又一次的“推理”过程，这在技术里叫做“推断”（inference）。但模型在推断时不学新东西。它只执行，不进步。想让它更聪明，得重新训练。这就决定了现在的AI有“知识截止点”——比如只知道2024年之前的事情。

要想让AI变得真正动态、实时、能学，核心挑战是打破“训练-推理”二分。这个问题没解决之前，AI都还停留在“高级压缩工具”阶段，而不是“智能体”。

说到底，今天的AI是数学的胜利，是计算的胜利，但还不是理解的胜利。它是人类训练出的最强预测器，不是最强思想家。我们给它喂了世界，它吐出一个“拟世界”。

这个“拟世界”越来越像真的，但它永远是预测，不是洞察。越是理解AI的人，越不会被它的“语言能力”所迷惑。它只是学了“像人”，而不是“是人”。

AI的进化，不是靠天才灵光一现，而是靠亿万次的梯度下降。这条路走到哪一步，取决于我们对“理解”的再定义。而不是对“机器”的崇拜。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。