
AI 的天花板,比所有人说的都低
TL;DR
“AI 短期高估、长期低估”是个被金融叙事撑着的半个命题。LLM 的效用域被锁在符号空间,软件工程的生产率从来无法测量——“长期低估”成立,需要一种根本不同于统计学习的新范式。
AI 的真实边界:从金融叙事到认识论天花板
一、起点:一个被金融化的科技命题
“AI 短期被高估,长期被低估”——这是 Amara 定律在 AI 上的经典表述,听起来稳妥,但它同时包含了两条不同性质的叙事:
科技叙事:技术采用曲线有惯性,初期期待过高,最终价值会超出预期。
金融叙事:资本永远投资于未来、买预期。资本进入某个行业,必然产生泡沫。在卖方市场上,持仓者有结构性动机鼓吹标的——不需要协调,是市场机制本身的产物。
这两条叙事叠加在一起,才产生了当下 AI 市场的形态。但它们需要被分开检视,否则论点的后半句“长期低估”会被前半句的逻辑悄悄撑着,而两者其实是独立的赌注。
科技叙事那一半不是假的。技术确实会被低估——蒸汽机、电气化、互联网,每一次都经历了“泡沫破裂→真实扩散→超出早期预期”的路径。Amara 定律在历史上成立,是因为这些技术最终突破了早期的应用边界,渗透进了更广的现实域。
问题在于:这个渗透,是有条件的。电气化能扩散,是因为物理域本身欢迎电力——它降低了摩擦,没有引入新的不确定性。LLM 的扩散遇到的是相反的情况:越深入现实域,不确定性越高,而不是越低。
所以科技叙事的后半句“长期低估”,成立的前提是技术能扩散。这个前提在 LLM 范式下,需要被单独论证,不能从历史规律里直接借用。
需要说明的是:本文讨论的是当前主流 AI 范式——以 LLM 为代表的统计学习路径。不是对所有可能的 AI 路径下判断,而是对这条路径的效用边界做评估。
二、卖的不是产品,是"胜率"
先说清楚一件事:泡沫本身就是对价值的证明。资本不会给零价值的东西吹泡沫——AI 有真实价值,这正是泡沫能够形成的前提。没有未来、没有价值的行业,在资本市场连泡沫都没有资格产生。
争议不在于"有没有价值",而在于**“在哪个域里值多少”**。定价打到了"AI 能渗透整个现实域"的预期上,但真实效用域可能只有符号空间——这两个量级的落差,才是问题所在。
AI 投资的 ROI 至今无定论。已经投入了数千亿美元,如果收益真实,账应该早就可以算清楚了。这个落差本身就是信号。
真正诚实的说法是:现在相当大一部分 AI 投资,本质是期权,不是对当下效率的投资——押注的是“如果通用 AI 某天成立,先投的人拿到的是入场券”。期权可以合理地在很长时间内看不到传统意义上的回报,这本身无可厚非。
问题在于卖方把期权包装成了确定性的效率收益来卖。这和 2008 年次贷危机有一个结构上的相似:
2008 年次贷危机的操作是——把“借款人可能还款”这个概率,经过层层包装转手,最终卖给了不了解底层风险的人,并且有专业机构为这种包装背书。这不是捏造收益,是把不确定性重新贴了“安全”的标签。
AI 叙事做的是同一件事——把“AI 可能改造生产力”这个概率,通过媒体、分析师、KOL 层层打包,卖成了确定性的效率革命。最后买单的,是用确定性预期做决策的企业(大量订阅)、政府(算力补贴)和普通投资者。
三、泡沫破裂的形态:钝刀,不是断头台
但 AI 泡沫不会像 2008 年那样有一个干净的引爆时刻。
次贷危机的底层“胜率”其实是可以算清楚的——借款人收入、房价历史数据都存在,只是被故意藏起来。一旦房价下跌,真实的还款能力暴露,链条立刻断裂。有明确触发点。
AI 的胜率是根本不可知的——不是被藏起来,是真的没人知道。AGI 会不会来,Scaling Law 还能走多远,连做模型的人自己都不确定。没有可以被戳破的底层数据。
所以 AI 泡沫的结局更可能是长期的钝刀割:ROI 持续出不来,预期一点点修正,资本缓慢撤退,叙事悄悄从“效率革命”换成“特定场景有用”。不会有一个清晰的崩溃时刻,只有叙事的慢慢失血。
四、ROI 为何出不来:效用域的真实边界
AI 对软件开发的影响被公认为最大——代码是纯符号空间,可以快速验证,AI 在这里的效用是真实的。但软件工程的成本结构决定了这种效用的天花板:
软件工程真正的成本中心是:需求澄清与对齐、跨角色摩擦(产品/研发/测试/运维)、决策等待、返工和上下文切换。代码本身只是这个成本结构里占比较小的一环。AI 把这一环压缩了,其余的基本没动。甚至有反效果——代码生成变快了,但需求不清楚的问题被放大:你能更快地构建出一个错误的东西。
推广到更广的行业:越接近物理世界,AI 的效用越低。 这背后有三个根本约束:
长尾问题是无底洞。 自动驾驶是最清晰的案例——99% 的场景 AI 处理得很好,但那 1% 的边缘情况几乎是无限的。软件里的 bug 可以快速 patch,物理世界的边缘情况不能。
错误代价不对称。 数字域的错误成本极低,可以无限迭代。物理域的错误代价是设备损坏、人身安全、生产中断。AI 的概率性本质与这个要求天然冲突。
数据的性质不同。 AI 的原生域是 token——离散的、可以无限复制、几乎零成本采集。物理世界的数据是连续的、采集成本高、噪声大,仿真和现实之间永远有 gap。
五、天花板的认识论根源
这三个约束指向了一个更深的问题——这不只是工程问题,而是当前 LLM 范式的根本限制。
LLM 基于 next-token prediction,本质是从有限数据里提取统计规律。而物理世界的长尾,本质是小概率但真实存在的事件空间是无限的。用有限统计覆盖无限可能性,永远有 gap,而且这个 gap 不会随着模型变大而消失,只会缩小但不归零。
换一个架构(世界模型、神经符号、强化学习)能缓解,但在统计学习这条路径上逃不掉——因为任何从数据中学习的系统,都面临同一个约束:训练分布之外的现实永远存在。物理世界不会停止产生新的边缘情况。
由此得出:在当前范式下,LLM 的效用域被锁在符号空间。 语言、代码、图像生成、推理——这是 LLM 的原生栖息地,效用真实。一旦需要跨越符号到现实的接口,效用就开始衰减。
这直接动摇了“长期低估”的命题。Amara 定律隐含的前提是:技术最终会扩散到更广的现实域,所以长期会超出预期。但如果这个扩散在 LLM 范式下有物理和认识论的双重硬边界,长期的天花板可能比通常理解的要低得多。
六、软件工程的生产率悖论是一个假命题
通常用来解释 AI ROI 迟迟出不来的理由是“生产率悖论”——技术采用需要时间,组织变革需要更长时间,等等。
但这个解释在软件工程领域根本不成立,因为悖论的前提条件不存在。
这个悖论最初来自经济学界的观察:IT 投资大幅增加,但宏观层面的生产率数字并没有跟着涨。这个悖论能够成立,是因为制造业、服务业的产出有可测量的基准:产量、销售额、交付时间。
软件工程从来没有这个基准。代码行数是反指标。迭代点数是团队自定义的。功能交付速度和用户价值之间没有稳定关系。你无法定义“一个软件工程师的标准产出”是什么。
“软件工程的生产率悖论”是一个被借用的错误类比。 它的功能不是解释现象,而是为 ROI 出不来提供体面的等待理由。“悖论”这个词本身,就是叙事工具之一——在一个本来就无法测量产出的行业里,它变成了无限期的空白支票:效果在,只是看不见,等等就好。
七、撞墙的真实形态
软件工程是 LLM 影响最大、最容易验证的行业。如果连这里的 ROI 都无法被证明——不是“不存在”,而是永远无法被证明——那整个论点链条就闭合了。
这不是技术失败,而是认识论失败。
技术失败会有明确的崩溃时刻,之后可以重建叙事。认识论失败的结局是叙事耗尽:CFO 问 ROI,没有答案;续订的时候,没有人能拿出一份说得通的报告;预算被压缩,不是因为证明了无效,而是因为从未证明过有效。
这种失血比硬崩溃更难处理,也更难被外界识别。
卖方从来不是不知道这堵墙。他们只是在墙被普遍看见之前,完成了出货。
结语:重新定价,不是 Amara 定律
整理下来,原始命题需要被修正:
“短期高估”——成立,逻辑链完整。
“长期低估”——成立的条件非常苛刻,它需要出现一种根本上不同于统计学习的新范式。不是更大的模型,而是不同性质的智能。在那个范式出现之前:
AI 短期高估;在新范式出现之前,现实域被系统性高估,符号域趋向合理定价。
这不是泡沫之后价值回归的经典叙事,而是一个有边界的重新定价过程——边界在哪里,取决于下一个范式什么时候到来。



