狂热与泡沫的尽头:Token 估值神话与昂贵的加密圈投机狂欢
变革常数
Tokenmaxxing(代币最大化)是不可避免的。
当企业开始基于AI使用情况来监控、排名和奖励员工时,人们自然会做出任何激励体系都会教会他们做的事情:管理指标。你告诉我如何计分,我就告诉你人们会如何钻空子。
本周感觉像是这场狂热梦境中的第一道裂痕。经过18个月几乎全是惊叹号的AI热潮后,终于有人开始提出那些不礼貌但必要的问题:这要花多少钱?它改进了什么?”使用量”真的是价值的代理指标,还是只是一个非常昂贵的参与奖?
直到最近,提出这些问题还会让你听起来像个AI怀疑论者——站在无限智能游行队伍后面,嘀咕着毛利率的人。但现在账单已经落到真实的损益表上,这个问题变得不那么禁忌了。
氛围正在微妙地转变。Axios在报道AI的”标价冲击”。Uber的COO表示支出越来越难以合理化。据报道,微软正在撤回Claude Code许可证。亚马逊据称在员工通过做无意义的AI事情来赚取AI积分后,取消了内部AI排行榜。





希望这标志着企业AI进入一个更理性阶段的开始:少一些表演,多一些单位经济学。几点思考:
- Tokenmaxxing是一个明显的激励问题 这是一个公认的真理:人们会钻指标的空子。大多数公司运行的是AI活动计划,而不是AI生产力计划。而活动是很容易制造的。在SaaS时代,表演性活动主要浪费的是时间。在AI时代,表演性活动消耗的是GPU支撑的边际成本。
- 企业混淆了消费与转型 “AI使用量”成了新的”数字化转型”仪表盘指标:容易向上汇报,难以与客户价值挂钩。但代币是输入成本,而不是产出衡量指标。一家工厂吹嘘自己用了更多电力听起来会很荒谬,除非产出、良率或吞吐量有所改善。AI应该以同样的方式衡量。
- 企业将SaaS的直觉带入了计量计算的世界 将AI视为传统SaaS是一个战略错误。在SaaS时代,采用率通常是价值的合理代理指标。使用Salesforce、Slack、Figma或Workday的席位越多,通常意味着该工具已嵌入工作流程。但前沿AI是计量计算。边际成本曲线很重要。正确的运营模式看起来不像软件赋能,而更像云FinOps:预算、上限、可观测性、单位经济学和工作负载治理。
- “AI强制令”让员工对AI的实际效用不再诚实 当领导者暗示AI使用是现代性的证据时,员工即使AI增加了摩擦也会理性地使用它。他们使用AI是因为不使用AI开始让人感到政治不安全。这污染了反馈循环。管理层无法了解AI真正有用的地方,因为员工被激励去制造使用量,而不是揭示工具在哪些方面薄弱、不必要或净负面。
- 赢家会知道在哪里不使用AI
战略性的AI成熟度不是最大化,而是选择性。持久的优势将来自路由:哪些任务值得使用前沿模型,哪些可以使用更便宜的模型,哪些应该缓存,哪些应该自动化,哪些应该保持人工操作,因为成本或错误特征不合适。”AI无处不在”不是一种策略。
- 为开源和RLaaS注入强心剂
我关注RL-as-a-Service市场已经有一段时间了,核心论点正变得越来越相关。前沿模型是强大、昂贵、非人格化的黑盒API。对于许多企业工作流程,更好的长期答案可能是在狭窄、高价值的用例上对开源模型进行后训练:这些模型对任务来说足够好,运行成本更低,并且通过专有数据和工作流程反馈日益差异化。
这个市场尚未完全起飞,因为前沿模型改进如此之快,以至于许多买家不愿为了优化成本而冒性能损失的风险。但如果成本审查加剧,同时开源对更多企业工作负载变得”足够好”,那么计算方式就会改变。
过去两年,主导问题是:哪个模型最聪明?随着预算收紧,更有趣的问题变成了:哪个模型足够聪明?
希望这是AI表演的终结,也是AI单位经济学的开始。过去18个月,企业的问题是:”我们的员工在使用AI吗?”下一个问题将是:”哪个工作单元变得更便宜、更快、更好,或者变得可能?”这种转变比成本恐慌本身更重要。