搜索

AI是数学的胜利,不是理解的胜利,它是最强预测器,但不是思想家

发布日期:2025-05-21 21:51 点击次数:116

图片

老胡科学2025-04-30 23:18优质科学领域创作者

人工智能的核心,不在“智能”,而在于它其实是一台复杂的、矩阵乘法驱动的压缩与预测机器。

它的“神经网络”,不是脑神经,不生电,不会痛,它只是层层函数、堆堆参数。数十亿乃至数万亿的浮点权重,在一场场矩阵乘法中计算出下一个字、下一个图像像素、下一帧蛋白质的结构。

图片

“模型”,并不是有意识的存在,而是算法与数据的直接产物。一个模型的“推理”,不过是生成一串自洽的中间步骤,符合训练中“看起来像推理”的数据统计特征。这不是逻辑演绎,而是“看起来像”。

今天AI的能力,来自“预训练”四个字。这不是训练它完成某个任务,而是先给它喂进整个互联网。网页、维基百科、小说、论坛对话、GitHub代码……先让它什么都看。然后才来“微调”,让它听人话、写邮件、画图、下棋。

真正颠覆行业的,是“生成式AI”。这一类模型,能够从输入中生成输出,而不是仅仅分类、打标签。GPT是生成文本,DALL·E是生成图像,AlphaFold是生成蛋白质结构。背后都是一套类似的逻辑:Transformer架构。

Transformer不是一个术语,是一个分水岭。Google在2017年推出的这项结构,把所有输入都看作序列,不管是语句、图片、视频帧、还是棋盘。它不再按顺序处理数据,而是一次性关注所有位置的“上下文”,换句话说:学会“看全局”。

Transformer的革命性不在于数学多高级,而在于它兼容性太强。图像识别、语音识别、机器翻译、聊天机器人,全都能用。换句话说,它是AI界的万能接头。

而这背后跑的,其实都是同一类操作:矩阵乘法。神经网络运行的本质,就是无数个矩阵乘法叠加优化。这也解释了为什么今天的AI烧电烧得吓人,为什么英伟达靠卖GPU成为了AI军火商。能把矩阵乘法跑得快,就是通向未来的钥匙。

也正因如此,整个AI世界疯狂追求一种能力:泛化。也就是让模型在没见过的数据上依然表现得靠谱。模型不是懂,它是“猜得像”,而“猜得像”靠的是海量数据加上微妙的参数调整。

可参数再多,错也照样会犯。AI“幻觉”就是最典型的例子。它不是故意编造,它是自信地输出一个在统计上看起来合理但事实上完全错误的答案。胡编乱造的引文,都是这么来的。这不是bug,是机制本身决定的。

“强化学习”成了人类用来纠偏的方法。告诉AI什么样的答案“奖励”更高,让它学会少犯错、多听话。但别以为这是训练“逻辑”,它本质上仍然是“调参”。我们在行为上引导它,但它并不理解“为什么”。

机制可解释性(Mechanistic Interpretability)是最近几年AI研究最硬核的方向。它想要回答一个问题:我们训练出来的这些庞大网络,内部到底学了什么?有没有“电路”?有没有“概念”?有没有“模块”?这是拆机式的神经网络解剖。

研究人员开始尝试在模型内部定位“黄金门大桥”对应的神经元,逆向还原它是怎么学会这些语义的。有些甚至找到了人工构建的“推理回路”——一个个自动生成的类电路结构,确实负责某种任务。但整体仍是一座黑箱,只是“灰”得没那么彻底了。

还有一类问题更现实:数据从哪来?答案是“合成数据”。很多时候,真实世界的数据不够干净、不够全,甚至存在偏见。那怎么办?用生成模型自己生成一批新数据,再拿来训练另一个模型。这就是AI喂AI,自我繁殖。但如果过度依赖,它会陷入“模型坍缩”:学来学去,只是在模仿自己。

模型到底有没有偏见?有。而且来自数据本身。例如,“CEO”更常被生成成白人男性。这是网络数据的事实反映,也是模型训练的现实产物。要解决,不是靠政治口号,而是靠“偏见干预”:训练过程中加入偏好、限制和奖励机制,让模型向某种期望靠近。

那AI到底有没有“理解”?从“嵌入”(embeddings)说起。模型内部所有的信息都被转化为一堆浮点数,这些数之间的相对关系,就是模型的“语义空间”。“狗”离“幼犬”近,离“烤面筋”远。它不理解词义,但它在数字上“排列”得很合理。

“推理”也不是传统意义的推理。模型在“推理”时,只是在生成一个“思维链条”的文本序列。这些链条可以看起来像思考的过程,但其实只是预测下一个最合理的词而已。你说它思考,它其实在模拟思考的形式。

而整个AI系统的前提,是一次又一次的“推理”过程,这在技术里叫做“推断”(inference)。但模型在推断时不学新东西。它只执行,不进步。想让它更聪明,得重新训练。这就决定了现在的AI有“知识截止点”——比如只知道2024年之前的事情。

要想让AI变得真正动态、实时、能学,核心挑战是打破“训练-推理”二分。这个问题没解决之前,AI都还停留在“高级压缩工具”阶段,而不是“智能体”。

说到底,今天的AI是数学的胜利,是计算的胜利,但还不是理解的胜利。它是人类训练出的最强预测器,不是最强思想家。我们给它喂了世界,它吐出一个“拟世界”。

这个“拟世界”越来越像真的,但它永远是预测,不是洞察。越是理解AI的人,越不会被它的“语言能力”所迷惑。它只是学了“像人”,而不是“是人”。

AI的进化,不是靠天才灵光一现,而是靠亿万次的梯度下降。这条路走到哪一步,取决于我们对“理解”的再定义。而不是对“机器”的崇拜。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。
查看更多