人工智能泡沫讨论忽视的一点:新增用例边际成本在下降
为何把铁路和电信的经济学拿来与人工智能类比并不恰当
周六愉快,欢迎收看《投资人工智能》。别忘了收听 AI in NYC 播客 。最新一期与 Alayna Kennedy 探讨 AI 治理,很有趣。我们还推出了一个新的 New York GPT 机器人,专门提供关于纽约市的信息,如果你住在这里或计划来访,去看看吧。
人们常把 AI 泡沫与铁路或电信产业的早期阶段相比,试图类比这些领域的资本支出与最终由这些投资带来的收入。但这种比较具有误导性,因为在铁路和电信中, 支出是为了连接事物 。每一条新铁路线都需要钢材、劳动力、土地使用权以及多年的建设。电信则需要在大陆间开沟铺设光纤。收入随着物理部署呈线性增长——每新增一英里都很昂贵。
在人工智能领域,情况正好相反。开发我们的 AI 引擎成本高昂。 将事物连接到我们的 AI 引擎则很便宜,而且越来越便宜 。一个新的数据管道。一个提示模板。一个 API 集成。一个 MCP 服务器。你不是在挖壕沟——你是在复制软件。这意味着资本支出与收入的曲线应该与铁路或电信行业有根本不同的表现。那些行业在收入追赶之前需要数十年的物理建设。AI 只需要数月。
我们以前也听过这种关于经济不可行性的论调。2009 年,麦肯锡发布了一份名为“ 澄清云计算的误解 ”的报告,将云描绘为被过度炒作,断言 AWS 比自己运行数据中心贵 144%,并得出结论认为大型企业无需为此费心。他们说,云计算可能导致“幻灭谷”。他们错了——且是极其严重的错误。如今云已成为一个超过 6000 亿美元的市场,是现代企业的中坚。今天同样的模式——太昂贵、没有盈利路径、被过度炒作——正在 AI 领域上演。我认为批评者再次错判了。
我的观点是:如果存在泡沫,也只是一个小泡泡,而且会缓慢破裂。原因如下。
1. 我们已经建好了引擎。现在是把它们连接起来的时候了。
我们已经在开发 AI 上投入了数千亿美元。现在是连接这些成果的时候。将 AI 连接到数据和系统以执行有用任务并产生收入的成本很低——与构建模型本身相比要便宜得多——而且成本每月都在下降。
这些数字令人震惊。根据 Epoch AI 的研究 ,推理价格每年的下降幅度取决于能力水平,范围在 9 倍到 900 倍之间,中位下降率在 2024 年 1 月之后从每年 50 倍跃升至每年 200 倍。斯坦福的 AI 指数发现,达到 GPT-3.5 级别的性能成本在短短 18 个月内从每百万标记 20 美元降至 0.07 美元——下降了 280 倍。Andreessen Horowitz 记录到,实现同等推理性能的成本大约每年下降 10 倍 ,这一速度超过了个人电脑计算革命和互联网带宽爆发时期。

这是泡沫叙事完全忽视的部分。将 AI 部署到新的用例的边际成本并不是再来一次价值一亿美元的训练运行,而是提示工程(几乎免费)、用于将模型连接到专有数据的 RAG(无需重新训练),或者为特定工作流程进行的轻量微调(仅为完整训练成本的一小部分)。引擎已经搭建完毕。铺设轨道的成本很低。
公司已经在这么做。根据 Menlo Ventures 2025 年报告 ,企业生成式 AI 支出在 2025 年增长了三倍,达到 370 亿美元,其中超过一半——190 亿美元——流向应用而非基础设施。Adobe 在一个季度内通过基于现有基础模型的独立 AI 业务实现了 1.25 亿美元的收入。Zendesk 对每个由 AI 解决的工单收取 1.50 美元。这些都不需要新的模型。这就是边际部署成本下降在实践中的样子,并且它应当比仅基于资本支出的叙事预示更快的收入增长。
2. 我们处于大型机阶段。个人电脑正在到来。
我们正处于 AI 的大型机计算阶段。大型、集中的系统——来自 OpenAI、Anthropic、Google 的前沿模型——对于集中开发力量并展示 AI 能做什么是必要的。这个阶段奏效了。数十亿人现在已经与这些系统互动过,能力已被充分理解。
但正如计算并未停留在大型机时代一样,AI 也不会一直集中化。我们正在进入个人电脑时代:一个更加去中心化的生态系统,更小、更专门化的模型将在更贴近工作的地方运行。
麦肯锡 2025 年全球人工智能调查显示 88% 的组织现在在至少一个业务职能中使用人工智能,高于 2017 年的 20%,其中三分之二在多个部门中使用。增长是横向的——在 HR、法律、市场、运营、财务等领域扩展,而非向更大模型的纵深扩展。

这就是大型机向个人电脑的实时过渡。资金正从制造引擎转向将引擎部署到处可用。就像个人电脑革命一样,真正的经济影响不会仅来自硬件制造商——而是来自数以百万计建立在其之上的应用程序。
3. 2025 年晚些时候达到质量临界点
截至 2025 年 11 月下旬,模型的质量在许多应用场景上达到了一个临界点。此前从未可能的端到端工作流程现在对于有意义的工作类别已可实现。这不是渐进式改进——而是阈值的跨越。
编码成为 AI 的第一个杀手级用例,企业支出达 40 亿美元,且有 50% 的开发者现在每天使用 AI 工具。但其蔓延速度很快:顾客 服务自动化、文档处理、合规 监控、销售情报、临床文档等。摩根士丹利指出,尽管早期 LLM 用例局限于内容生成和摘要,但最大且未被充分开发的机会是将 AI 推理应用于企业数据——情境感知的推荐、流程优化和战略规划。
这一质量里程碑正是“有趣的演示”与“能产生收入的生产工作流”之间的差别。而这一差别对泡沫问题至关重要。资本支出是投资。质量临界点是该投资开始转化为回报的时刻。我们现在正处于这一时刻。
4. 去中心化工具正在构建中
推动采用并实现 AI 去中心化的工具正在积极开发中。三项能力正在汇聚,将从根本上改变部署经济学:
模型切换与路由。 能够将任务动态路由到合适的模型——需要深度推理时用前沿模型,不需要时用轻量模型。对支持工单进行自动分类或从发票中提取字段并不需要 GPT-4 级别的智能。仅靠智能路由就能将许多企业工作负载的推理成本降低一个数量级。
开源成熟度。 开源模型正在以比大多数分析师预期更快的速度缩小与专有替代品的差距。根据 OpenRouter 的数据,推理提供商数量在 2025 年从 27 家增长到 90 家,流行的开源模型现在由 20 多家不同的提供商提供服务。这带来了真正的价格竞争和部署灵活性。
小任务模型。 这是关键。为常见、狭窄且专有的工作流程定制的模型。大多数业务任务并不需要一个有四千亿参数的前沿模型。作为概念验证,在 Neurometric 我们训练了一个 40 亿参数的模型,在特定的 CRM 相关工作任务上击败了前沿模型 。这个模型运行成本极低,几乎免费。世界正在朝这个方向发展——这也是 Neurometric 正在构建的能力集:轻松在模型之间切换,在适当的时候采用开源,并为真正带来业务价值的工作流程创建小任务模型。
这三种能力共同构建了一个比当前“泡沫”预测所考虑的任何方案都更快、更便宜、更具适应性的部署层。我每天在我们的客户群中都能看到这一点,企业正在采用模型系统而不是单一的大模型。
5. GPU 折旧论点忽视了推理革命
GPU 折旧论——今天昂贵的芯片在自我回本之前就会贬值——表面上合乎逻辑。但这一论断假定了当前芯片生态的相对静态状态,忽视了围绕推理发生的所有创新,而推理在短短几年内将占到 80% 的 AI 工作负载。
考虑已经在进行的变化:NVIDIA 收购 Groq 将加速其在推理优化方面的更广泛推进。超级云提供商们开发的定制推理芯片——Google 的 TPU、Amazon 的 Trainium、Microsoft 的 Maia。以及刚进入消费和企业设备市场的边缘 NPU。每一种都代表了一层 AI 能力和成本效率,使得目前的折旧模型显得过时。两年后的芯片格局将与今天截然不同,并将实现现在看似不可能的多层 AI 能力。
真正的数学:前沿模型将成为少数派
AI 推理将成为有史以来最大的市场之一。规模将达到数万亿,可能是数十万亿美元。我的预测是,大约 25% 的需求将需要前沿模型——是的,那些前沿模型实验室会有不错的表现。他们将有数万亿美元的可寻址市场(TAM)可供运作。
但有 75% 的应用将运行在开源和小型专用任务模型上。训练这些模型成本更低,推理成本更是更低。我们的 CRM 实验具体证明了这一点:一个 4B 参数的模型在特定业务任务上超过了前沿模型,且运行成本接近于零。把这种模式复制到数千个企业工作流程上,你就能看到市场的真实形态。
我们今天对 AI 做出的所有经济预测,都是基于训练前沿模型的经济学。 它们忽视了一个事实:随着行业成熟,这些前沿模型将成为 AI 用例的少数 。
华尔街正盯着大型主机,试图推断那对计算未来意味着什么。他们忽视了个人电脑近在咫尺——而个人电脑改变了一切。
当你放眼五年,人工智能的经济学不会与今天相同。如果有泡沫,也是个小泡沫,而且会轻轻破裂。真正的故事是接下来会发生什么。
感谢阅读。