你们昂贵的 AI 算力账单已经到期,到底谁来买单?
💡 文章信息:作者:Simon Wu (Partner @ Cathay) | 英文原文:点击阅读
💡 核心论点
- 过去两年全球风投和科技巨头往 AI 硬件、模型训练里疯狂砸入了数以千亿计的美金,这笔庞大的基建账单已然到期。
- 算力开支的高昂推理成本正在一级级向软件厂商和最终企业用户端强力分摊。
- 如果应用端无法通过切实提高用户业务 ROI(投资回报率)来实现大幅度的提价,高昂的算力消耗将彻底吞噬整个 AI 软件生态的利润。
📑 严格逐字逐段翻译
您的人工智能账单即将到期。谁付钱?
如果我们希望每个人都使用人工智能,谁负责确保它正常工作?谁付帐单?没有人有明确的答案。这就是问题所在。
账单刚到。
刚刚发生的事情是这样的:企业意识到他们已经用完了 2026 年的全部人工智能预算。不是明年。今年。
巧合的是,OpenAI 刚刚赠送了两个月的免费 Codex 访问权限。
[翻译失败,请检查网络]
OpenAI 的免费 Codex 服务是对企业现在大声询问的一个具体问题的回应:该产品值得我们付出的代价吗?
隐形成本时代正在结束。
人工智能支出过去常常隐藏在小项目中——SaaS 席位、T&E、实验预算。现在它正在成为一条真正的损益线。首席财务官们开始问:我们实际上能得到什么?
大多数公司都没有一个好的答案。现在他们在试图解决这个问题时预算已经用完了。
真正的问题是测量。
您可以看到谁有权使用人工智能。 你看不到他们用它生产什么。使用 3k 代币的人和使用 10k 代币的人在预算报告中看起来是相同的。
其中一位可能是您最有生产力的员工。其中一个可能是您最浪费的。如果不了解输出,您就不知道哪个是哪个。
没有产出测量的人工智能支出只是一个更大版本的货架。你付了钱。人们使用了它。没有人知道这是否重要。
为什么云优化在这里不起作用。
云优化之所以有效,是因为浪费的单位很明确:空闲计算。你可以看到它,这意味着你可以切割它。
人工智能有着根本的不同。价值单位不明确,因此减少错误的使用可能会破坏您不知道的生产力。
这就是杰文斯悖论让事情变得更加困难的地方。随着人工智能变得越来越便宜,更多的工作变得值得做。积压的订单清除。新作品出现。体积扩大。这是一件好事。
但它产生了一个新问题:
你最终会做更多的事情 – 包括本来不应该做的工作。
成本是错误的框架。
因此,这让您想知道:好的输出实际上是什么样的?
这就是组织崩溃的地方。大多数公司都在不改变其运营方式的情况下推动人工智能的采用。如果人工智能可以做三个人过去做的事情,你有三个选择:
减少员工人数
重新部署人员
或者让他们继续忙于人工智能已经在做的工作
大多数公司默认选择第三种。
成为人工智能原生意味着重组,而不仅仅是添加工具。
成为“人工智能原生”意味着重构工作完成方式。大多数公司都会跳过这一部分。这就产生了新的管理问题。您不再只管理人。您正在管理一个由人类和代理组成的系统。代理商没有绩效评估。他们不会反击。 他们不承认任务是错误的。
这意味着监督成为关键职能:
正在做什么
是否有效
何时干预
真正的管理挑战是系统设计:人和代理如何分工,以及如何衡量分工是否有效。
测试正在进行中。
OpenAI 的免费提供是一种强制揭示:企业会花钱购买更好的模型,还是选择更便宜的模型?
许多企业即将给出的答案将告诉市场很多关于人工智能定价和功能价值的未来。如果企业集体说“我们会选择更便宜的选择”,那就是一个信号。如果他们说“我们需要更好的模型,成本见鬼去吧”,那就是一个不同的信号。
谁拥有这个?
不管怎样,人工智能法案都会到来。
将其视为成本问题的公司将优化成本并破坏隐藏的生产力。那些将其视为管理问题的人将建立明确的责任并建立持续改进的运营结构。
谁负责让人工智能在您的组织内真正发挥作用 – 您如何衡量它?
关于这篇文章的讨论
没有帖子
准备好了解更多了吗?
📌 核心金句与关键指标
[!NOTE]
““风投机构大笔补贴大模型训练和疯狂烧钱的荒唐期已告终结;如今,每一款 AI 软件工具都必须拿出不容辩驳的硬性 ROI 和实打实的省钱成效,来证明其高昂定价的合理性。””
🎯 行业启示与落地建议
- 投资 AI 软件应当一票否决那些“纯炫技、无法向企业证明具体能省多少人工和时间”的项目。
- 重点寻找能通过精细化算法调优、模型蒸馏和自建小模型实现“算力推理成本极速腰斩”的技术型极客团队。