代币经济中的衡量系统
作者: Shirlawn Capital
免责声明: 本翻译仅供个人阅读和学习参考,不得用于任何商业用途或进行随意转载发布。
本周早些时候,Meta 内部的“Token Legends”排行榜泄露了。85,000 名员工在 30 天内消耗了 60 万亿个 token——相当于估计约 9 亿美元的计算支出。
至少到目前为止,Meta 的领导层鼓励(如果不是公开庆祝的话)这种向积极使用 AI 发展的趋势——不要管据报道许多工程师正在“tokenmaxxing”(为了看起来富有成效而烧掉 token)。黄仁勋就在上个月表达了类似的情绪,当时他告诉听众,如果一个年薪 50 万美元的工程师每年在 token 上的花费少于 25 万美元,他会“深感担忧”。
这真让人震惊:大型科技公司的领导层在建议人们更多地使用 AI。我想知道谁会从增加的模型使用中受益?但如果 token 预算正在成为一项标准的工作福利,并且绩效评估现在包含了 AI 采用指标,我们最好有一个衡量产出并核算 token 使用的良好方法。
基于使用量的定价模式的兴起
在 AI 时代,我们看到定价模式正逐渐从基于订阅转向基于使用量(Usage-Based Pricing, UBP)。事实上,就在昨天,《金融时报》报道称,Perplexity 的收入从 2 月到 3 月飙升了 50%(超过 4.5 亿美元),“这是在推出新的智能体工具并转向基于使用量的定价之后”。UBP 是协调模型提供商及其客户之间激励机制的绝佳方式。如果 AI 公司销售的是工作而不是软件,那么模型输出的数量就是完成工作量的一个不错的替代指标,因此也是量化客户支付意愿的一个不错的方法。即使对于喜欢基于订阅的定价的买家,卖家也在想方设法通过分层定价或基础定价+超额 token 额外费用来满足他们的需求。实际上,这些都是 UBP 的形式。
但我想更详细地强调上述两点。第一是为什么 UBP 会带来一些会计上的头疼问题;第二是为什么模型输出的数量只是完成工作的一个“不错的”替代指标,但远非完美。
UBP 的会计复杂性
ASC 606“与客户签订合同的收入”,是一个标准化的美国公认会计原则(GAAP)会计框架,它规定了企业确认收入的时间和方式。它强制要求一个模型,确保在承诺的商品/服务转移给客户时确认收入,将收入与履约情况而不是现金收入相匹配。因为 ASC 606,模型提供商在 token 被使用之前不能确认 token 的收入。有两种模式 ASC 606 不起作用:统一费率订阅或极端的 UBP。如果你对无限数量的 token 收取固定费用(例如每月),或者你实际上是实时向用户收取他们使用的每个 token 的费用,你就可以免于核算 ASC 606。但介于两者之间的任何模式——比如我上面提到的例子,都要求你在 token 被使用时核算收入,即使你预先收到了一笔月费。
这对于整个 AI 领域的财务部门来说是一个令人头疼的大问题。结果往往是一项巨大的递延收入负债,需要针对每个客户实时跟踪,并映射到产品数据库中的使用事件。
而对于一家每天处理数百万次 API 调用的公司的财务总监来说,正确执行此操作的工具并不存在。相反,这些构建尖端技术的复杂公司正在使用各种陈旧的内部工具拼凑起来,试图保持合规的审计。在遵守 ASC 606 方面的失误会导致财务重述、审计延迟和估值打击。对于处于 IPO 轨道上的公司来说,他们正争分夺秒地尽快解决这个问题。
缩小差距的竞赛
值得称赞的是,主要的计费平台清楚地看到了这一点并且行动迅速。
Stripe 在 1 月份以 10 亿美元收购 Metronome 是最明显的信号。Metronome 已经为 OpenAI、Anthropic、Databricks 和 NVIDIA 提供基于使用量的计费支持,每秒接收数百万个事件。但 Metronome 本身并不生成日记账分录;它存储原始数据并将收入确认留给下游系统。Stripe 的赌注是,通过将 Metronome 的计量引擎与 Stripe 现有的收入确认产品(确实能产生符合 ASC 606 的日记账分录)相结合,他们可以在同一个屋檐下提供从支付到分类账的完整堆栈。这个愿景很有希望,但仍在整合中。
但是,现在正在销售其产品的 AI 公司等不起。也许他们两年前开始使用 Stripe,加上了一个计量层,现在有一个财务团队试图协调那些从设计之初就无法相互通信的系统。拆除他们的计费堆栈以采用新平台是一个需要数月的项目,而且在此期间,他们仍然必须每个月进行结账。
一旦差距缩小——然后呢?
我在本文前面提到过,模型输出的数量是完成工作量的一个不错的替代指标,我小心地选择了这些词。聊胜于无,但在现实中,输出数量仅与输出质量部分相关。而输出质量则难衡量得多。当 AI 卖家试图弄清楚如何核算收入时,买家正试图弄清楚他们为 AI 工具付费的意愿——而他们比卖家更加盲目。
Meta 内部的“tokenmaxxing”例子就是期望与现实对比的完美例证。Meta 的高管期望通过激励员工使用 AI 模型,他们能使员工更具生产力。而在现实中,许多员工正在钻系统的空子,在循环中使用 token,以显得他们正在产生输出。这是一个相当极端的例子,但它显示了输出数量和输出质量之间的差异可能有多大。
不同的职业对输出质量的衡量方式不同。在客户服务中,解决的投诉是一个良好的质量输出指标,每个投诉的解决时间也是如此。工程可能会稍微不透明一些。推送到生产环境的代码行数是一个相关指标,但从理论上讲,1k 行代码和 2k 行代码产生的输出可能是相同的。其他行业呢?每个行业都有自己的成功衡量标准,甚至在不同行业中相同的角色对输出质量的衡量方式也可能不同。
没有统一的标准指标——那么企业应该从哪里开始呢?我怀疑顾问将在这里发挥重要作用,构建定制系统以帮助企业衡量特定类型的输出。我确信的一件事是:衡量 AI 输出质量将是一个关键指标,它对 AI 的采用速度有重大影响。而那些能够将输出质量直接与客户关心的 KPI 联系起来的垂直 AI 卖家,将拥有巨大的优势。
为代币经济构建基础设施
衡量代币经济(token economy)是一个金融科技的机会。它是一个人力资源/未来工作的机会。它是一个数据基础设施的机会。而且它远不止于此。我们将看到整个横向和垂直公司从代币经济中准确衡量和分配归因中获益匪浅。随着这些产品的成熟,整个生态系统——以及经济——都会变得更好。
对于寻找灵感的有抱负的创始人,或者已经开始在垂直机会上执行的创始人——开始思考你想如何衡量代币经济吧。