16 June, 2026

AI 的天花板，比所有人说的都低

AI 技术思考

TL;DR

“AI 短期高估、长期低估”是个被金融叙事撑着的半个命题。LLM 的效用域被锁在符号空间，软件工程的生产率从来无法测量——“长期低估”成立，需要一种根本不同于统计学习的新范式。

AI 的真实边界：从金融叙事到认识论天花板

一、起点：一个被金融化的科技命题

“AI 短期被高估，长期被低估”——这是 Amara 定律在 AI 上的经典表述，听起来稳妥，但它同时包含了两条不同性质的叙事：

科技叙事：技术采用曲线有惯性，初期期待过高，最终价值会超出预期。

金融叙事：资本永远投资于未来、买预期。资本进入某个行业，必然产生泡沫。在卖方市场上，持仓者有结构性动机鼓吹标的——不需要协调，是市场机制本身的产物。

这两条叙事叠加在一起，才产生了当下 AI 市场的形态。但它们需要被分开检视，否则论点的后半句“长期低估”会被前半句的逻辑悄悄撑着，而两者其实是独立的赌注。

科技叙事那一半不是假的。技术确实会被低估——蒸汽机、电气化、互联网，每一次都经历了“泡沫破裂→真实扩散→超出早期预期”的路径。Amara 定律在历史上成立，是因为这些技术最终突破了早期的应用边界，渗透进了更广的现实域。

问题在于：这个渗透，是有条件的。电气化能扩散，是因为物理域本身欢迎电力——它降低了摩擦，没有引入新的不确定性。LLM 的扩散遇到的是相反的情况：越深入现实域，不确定性越高，而不是越低。

所以科技叙事的后半句“长期低估”，成立的前提是技术能扩散。这个前提在 LLM 范式下，需要被单独论证，不能从历史规律里直接借用。

需要说明的是：本文讨论的是当前主流 AI 范式——以 LLM 为代表的统计学习路径。不是对所有可能的 AI 路径下判断，而是对这条路径的效用边界做评估。

二、卖的不是产品，是"胜率"

先说清楚一件事：泡沫本身就是对价值的证明。资本不会给零价值的东西吹泡沫——AI 有真实价值，这正是泡沫能够形成的前提。没有未来、没有价值的行业，在资本市场连泡沫都没有资格产生。

争议不在于"有没有价值"，而在于**“在哪个域里值多少”**。定价打到了"AI 能渗透整个现实域"的预期上，但真实效用域可能只有符号空间——这两个量级的落差，才是问题所在。

AI 投资的 ROI 至今无定论。已经投入了数千亿美元，如果收益真实，账应该早就可以算清楚了。这个落差本身就是信号。

真正诚实的说法是：现在相当大一部分 AI 投资，本质是期权，不是对当下效率的投资——押注的是“如果通用 AI 某天成立，先投的人拿到的是入场券”。期权可以合理地在很长时间内看不到传统意义上的回报，这本身无可厚非。

问题在于卖方把期权包装成了确定性的效率收益来卖。这和 2008 年次贷危机有一个结构上的相似：

2008 年次贷危机的操作是——把“借款人可能还款”这个概率，经过层层包装转手，最终卖给了不了解底层风险的人，并且有专业机构为这种包装背书。这不是捏造收益，是把不确定性重新贴了“安全”的标签。

AI 叙事做的是同一件事——把“AI 可能改造生产力”这个概率，通过媒体、分析师、KOL 层层打包，卖成了确定性的效率革命。最后买单的，是用确定性预期做决策的企业（大量订阅）、政府（算力补贴）和普通投资者。

三、泡沫破裂的形态：钝刀，不是断头台

但 AI 泡沫不会像 2008 年那样有一个干净的引爆时刻。

次贷危机的底层“胜率”其实是可以算清楚的——借款人收入、房价历史数据都存在，只是被故意藏起来。一旦房价下跌，真实的还款能力暴露，链条立刻断裂。有明确触发点。

AI 的胜率是根本不可知的——不是被藏起来，是真的没人知道。AGI 会不会来，Scaling Law 还能走多远，连做模型的人自己都不确定。没有可以被戳破的底层数据。

所以 AI 泡沫的结局更可能是长期的钝刀割：ROI 持续出不来，预期一点点修正，资本缓慢撤退，叙事悄悄从“效率革命”换成“特定场景有用”。不会有一个清晰的崩溃时刻，只有叙事的慢慢失血。

四、ROI 为何出不来：效用域的真实边界

AI 对软件开发的影响被公认为最大——代码是纯符号空间，可以快速验证，AI 在这里的效用是真实的。但软件工程的成本结构决定了这种效用的天花板：

软件工程真正的成本中心是：需求澄清与对齐、跨角色摩擦（产品/研发/测试/运维）、决策等待、返工和上下文切换。代码本身只是这个成本结构里占比较小的一环。AI 把这一环压缩了，其余的基本没动。甚至有反效果——代码生成变快了，但需求不清楚的问题被放大：你能更快地构建出一个错误的东西。

推广到更广的行业：越接近物理世界，AI 的效用越低。 这背后有三个根本约束：

长尾问题是无底洞。 自动驾驶是最清晰的案例——99% 的场景 AI 处理得很好，但那 1% 的边缘情况几乎是无限的。软件里的 bug 可以快速 patch，物理世界的边缘情况不能。

错误代价不对称。 数字域的错误成本极低，可以无限迭代。物理域的错误代价是设备损坏、人身安全、生产中断。AI 的概率性本质与这个要求天然冲突。

数据的性质不同。 AI 的原生域是 token——离散的、可以无限复制、几乎零成本采集。物理世界的数据是连续的、采集成本高、噪声大，仿真和现实之间永远有 gap。

五、天花板的认识论根源

这三个约束指向了一个更深的问题——这不只是工程问题，而是当前 LLM 范式的根本限制。

LLM 基于 next-token prediction，本质是从有限数据里提取统计规律。而物理世界的长尾，本质是小概率但真实存在的事件空间是无限的。用有限统计覆盖无限可能性，永远有 gap，而且这个 gap 不会随着模型变大而消失，只会缩小但不归零。

换一个架构（世界模型、神经符号、强化学习）能缓解，但在统计学习这条路径上逃不掉——因为任何从数据中学习的系统，都面临同一个约束：训练分布之外的现实永远存在。物理世界不会停止产生新的边缘情况。

由此得出：在当前范式下，LLM 的效用域被锁在符号空间。 语言、代码、图像生成、推理——这是 LLM 的原生栖息地，效用真实。一旦需要跨越符号到现实的接口，效用就开始衰减。

这直接动摇了“长期低估”的命题。Amara 定律隐含的前提是：技术最终会扩散到更广的现实域，所以长期会超出预期。但如果这个扩散在 LLM 范式下有物理和认识论的双重硬边界，长期的天花板可能比通常理解的要低得多。

六、软件工程的生产率悖论是一个假命题

通常用来解释 AI ROI 迟迟出不来的理由是“生产率悖论”——技术采用需要时间，组织变革需要更长时间，等等。

但这个解释在软件工程领域根本不成立，因为悖论的前提条件不存在。

这个悖论最初来自经济学界的观察：IT 投资大幅增加，但宏观层面的生产率数字并没有跟着涨。这个悖论能够成立，是因为制造业、服务业的产出有可测量的基准：产量、销售额、交付时间。

软件工程从来没有这个基准。代码行数是反指标。迭代点数是团队自定义的。功能交付速度和用户价值之间没有稳定关系。你无法定义“一个软件工程师的标准产出”是什么。

“软件工程的生产率悖论”是一个被借用的错误类比。 它的功能不是解释现象，而是为 ROI 出不来提供体面的等待理由。“悖论”这个词本身，就是叙事工具之一——在一个本来就无法测量产出的行业里，它变成了无限期的空白支票：效果在，只是看不见，等等就好。

七、撞墙的真实形态

软件工程是 LLM 影响最大、最容易验证的行业。如果连这里的 ROI 都无法被证明——不是“不存在”，而是永远无法被证明——那整个论点链条就闭合了。

这不是技术失败，而是认识论失败。

技术失败会有明确的崩溃时刻，之后可以重建叙事。认识论失败的结局是叙事耗尽：CFO 问 ROI，没有答案；续订的时候，没有人能拿出一份说得通的报告；预算被压缩，不是因为证明了无效，而是因为从未证明过有效。

这种失血比硬崩溃更难处理，也更难被外界识别。

卖方从来不是不知道这堵墙。他们只是在墙被普遍看见之前，完成了出货。

结语：重新定价，不是 Amara 定律

整理下来，原始命题需要被修正：

“短期高估”——成立，逻辑链完整。

“长期低估”——成立的条件非常苛刻，它需要出现一种根本上不同于统计学习的新范式。不是更大的模型，而是不同性质的智能。在那个范式出现之前：

AI 短期高估；在新范式出现之前，现实域被系统性高估，符号域趋向合理定价。

这不是泡沫之后价值回归的经典叙事，而是一个有边界的重新定价过程——边界在哪里，取决于下一个范式什么时候到来。