摩擦点:什么可能减缓AI火箭飞船的速度?
放缓还很遥远,但以下是需要关注的重点
来源:https://investinginai.substack.com/p/friction-points-what-could-slow-the
周日愉快,欢迎来到《投资AI》。如果你是新读者,请查看我们的播客——AI in NYC show,我们会在其中讨论本周AI新闻,并采访在纽约从事AI工作的嘉宾。你也可以访问Neurometric——我经营的公司,它利用SLM和其他优化技术,通过收取固定费用提供无限量token使用,从而降低你的AI成本。我们承担token风险并围绕它进行工程优化,这样你就能获得稳定的账单,比使用前沿实验室AI低90%。
永续增长的神话
每个技术时代都会产生自己看似违背重力的图表。1996年是互联网主机数量。2010年是智能手机出货量。如今是每季度处理的token数量和前沿模型的参数规模,两者都以似乎旨在嘲笑收益递减这一概念的趋势向上弯曲。主流叙事——更多算力带来更好性能,进而带来更多采用,从而证明更多算力的合理性——已成为硅谷的信条,被反复重复,足以冒充分析。

但每一条指数曲线最终都只是S曲线的左下段。有趣的问题不是AI增长是否会放缓,而是拐点在哪里,以及是什么导致了它。预测崩盘是容易的工作;明确那些在某个时刻会将指数级进步转化为线性进步的摩擦点,则更困难也更有用。
两个结构性天花板值得关注。两者都与数据或芯片耗尽无关。它们都关乎智能在边际上的单位经济性。
经济天花板:Token与劳动力
今天AI采用的最深层引擎是套利。美国一名熟练的知识工作者,全部成本约为每小时100美元以上。一百万token的前沿模型推理只需几美元。只要这些token能以合理的保真度替代一部分人类工时,这个差价就巨大,经济逻辑不言自明。
这个差值让采用看起来像是必然。但必然性假设这个差值会持续。它不必如此。
相关变量不是算力的绝对成本。而是下一个单位精度的边际成本。任何任务的前80%都很便宜。接下来的15%更贵。最后的5%——让模型足够可靠、无需人工检查即可部署的部分——是算力成本膨胀、劳动力节省缩水的地方。在某个阈值,获取下一个百分点精度所需的算力成本,超过了它所能替代的劳动力价值。
采用不会在那个点停止。它只是停止加速。前沿模型持续改进,但边际用户没有经济理由升级。我们以前见过这种模式:智能手机每年仍在变快,但大多数人不再注意到。

杰文斯悖论常被引用于此,它只说对了一半。更便宜的token确实会推动更多使用,就像更便宜的煤炭推动了更多蒸汽机。但杰文斯假设基础资源有无限的生产性用途。AI的生产性用途受到杰文斯无需应对的因素限制:输出接收端人类的认知带宽。存在一个饱和点,超过它后更多token不会产生更多价值,因为没有人能足够快地阅读、行动或信任它们以产生影响。
信任天花板:验证鸿沟
第二个摩擦更有趣,因为它是结构性的而非经济性的。
假设明天一个前沿模型生成了一个50页的证明,解决了一个此前未解决的数学猜想。地球上大概有100位数学家有能力验证它。他们的时间有限。即使能达成共识,也需要数年时间。在此期间,这个证明价值几何?
这就是专业验证鸿沟,它出现在模型输出超出用户评估能力的任何地方。生成性任务——起草邮件、写诗、总结会议——基本避开了这个问题,因为用户就是评判者。输出的价值就是用户认为它是什么。基于真相的任务则不同。当模型提出一个承重结构设计、一个肿瘤治疗方案、或一个百万行代码库的非明显重构时,用户不是评判者。用户是一个他们无法独立审计的逻辑链的旁观者。
不可验证效用的部署天花板远低于生成它的技术天花板。我们生产无法信任的输出的速度,快于我们建立所需机构——审计者、形式化验证工具、监管体制——来认证它们的速度。在高风险领域,没有验证的能力不是可部署的能力。它是负债。

人在回路中的瓶颈
这两个天花板汇聚在同一个地方。AI今天的价值与人类监督紧密相连:开发者审查生成的代码,放射科医生确认标记的扫描结果,分析师检查预测的合理性。这种监督的吞吐量决定了部署,而不是模型的吞吐量。
如果模型能力扩展10倍,而人类验证能力只扩展1.2倍,那么每个新能力增益的风险调整后回报就会缩小。超过某个点,没有更多监督的更多能力会产生负期望值,因为未检测错误的尾部风险增长快于平均收益。这种不对称是问题所在:在医疗、金融或基础设施领域,一千个正确输出无法弥补一个错误输出。
这就是为什么未来几年最重要的AI投资可能根本不在生成领域。它们将集中在自动验证——形式化方法、可解释性工具、对抗性评估、运行时监控、大规模模型评分判断——这些将原始能力转化为可信赖效用的不起眼基础设施。这比听起来更难。在许多领域,验证智能至少与产生智能一样困难。我们正在押注,产生不可验证输出的同类系统可以被释放出来验证它,而这个赌注的结构就像让狐狸去审计鸡舍。
新常态
当放缓来临时,它不会是技术失败。它将是市场达到其当前形态所能吸收的边界。能力将继续增长。约束将从供给转向吸收——人类、机构和验证系统代谢模型产出的速度。
我们正在离开所谓的AI魔法阶段,在这个阶段,每个新能力都像是不需要工程部署的礼物,并进入维护阶段。工作从制作下一个演示转向构建无聊的脚手架,让上一个演示在大规模下值得信赖。

对投资者来说,这不是坏消息。只是不同的消息。AI价值创造的未来十年可能更多属于那些构建将模型输出转化为可审计、可部署、可保险产品的乏味机制的人,而非训练最大模型的人。火箭飞船没有耗尽燃料。它正在接近飞行中你开始注意到空气阻力的阶段。
感谢阅读。