AI 应用与垂直整合
作者: Tanay Jaipuria
免责声明: 本翻译好的文章仅限于我自己阅读,不是转载和发布。
两种“全栈式” AI 应用公司
我是 Tanay Jaipuria,Wing 的合伙人,这是一份关于科技行业商业的每周新闻通讯。
朋友们好,
我一直在思考一个我们越来越频繁地在 AI 应用公司中看到的模式。随着时间的推移,我认为它们中的大多数都会变成“全栈式(full-stack)”。
从高层次来看,您可以将实现结果的 AI 产品视为具有三个层级:
- 在底层,模型(model)
-
在中间,包含数据/上下文等的应用程序(application)或智能体(agent)
-
在顶层,为了实际获得结果而需要进行审查/提示/完成最后一英里的人工(human)或服务层(service layer)

这显然是一种描述世界的简化方式。模型建立在芯片等之上,在构建智能体时有很多基础设施、数据系统、编排和评估。但我仍然认为这种简化是有用的。
传统的应用层公司只会位于中间层。但这些公司正越来越多地开始(或从一开始就)在两个方向之一进行垂直整合。一些向下进入模型层。另一些则开始或向上进入人工或服务层。两者最终看起来都是“全栈式的 [^1]”,只是方式截然不同。

1. 向下全栈 (Full stack down)
第一种全栈版本是当应用公司向下整合进入模型层时。
这是我们在编程、客户服务和少数其他类别中看到的模式,在这些类别中,公司有足够的使用量、足够的专有轨迹数据(traces),以及足够的经济动力来开始将智能(intelligence)引入内部。

Cursor 是一个非常近期的例子。上周它推出了 Composer 2,将其定位为前沿级别的编程模型,其基准性能有了显著提高,并且价格低于许多替代方案。在其技术报告中,Cursor 表示 Composer 2 使用 Kimi K2.5 作为基础模型,然后通过持续预训练加上在长视距编程任务上的强化学习来扩展它。
Intercom 本周也采取了类似的举措,推出了 Fin Apex。Intercom 首席执行官 Eoghan McCabe 将其描述为“垂直模型的时代”,并且 Intercom 表示 Apex 现在实际上为其所有英语聊天和电子邮件客户对话提供动力。

Cursor、Intercom、Cognition、Harvey、Sierra 等正越来越多地试图围绕特定领域来塑造、微调、路由,并在某些情况下训练智能本身。
为什么会发生这种情况?
最大的原因是,对于 AI 公司来说,这是他们推动性能提升所拥有的最重要的飞轮。他们拥有智能体的轨迹数据。他们能看到提示词、输出、编辑/接受/拒绝。随着时间的推移,这就变成了极具价值的专有训练数据。更好的产品创造更多的使用量。更多的使用量创造更多的轨迹数据。更多的轨迹数据使模型变得更好。然后,更好的模型再次改善产品。
其他原因包括:
- 成本和速度:一旦你有足够的规模,销货成本(COGS)就会增加,而更小、经过微调的模型最终可以以更低的成本和更快的速度为你的用例提供足够的性能。

Composer 2 在 CursorBench 上的效率和质量
- 差异化:如果一个类别中的每个人都在调用相同的少数几个模型,那么仅仅从智能层建立真正的产品距离就会变得更加困难。
2. 向上全栈 (Full stack up)

第二种全栈版本走的是另一条路。公司不是整合进模型中,而是向上整合进入人工或服务层。它销售的是真正的结果,而不是软件。
这是 Chris Dixon 在 2015 年写过的更经典的全栈式初创公司想法。你不只是将软件卖进一个工作流。你拥有端到端的流程,并向最终客户提供结果或服务。
从历史上看,这通常意味着糟糕的服务经济学和规模化挑战。但 AI 改变了那个等式的形态,并开辟了在许多原本没有吸引力的终端市场采取这条路线的可能性。
这种“销售结果,而不是软件”、“服务即软件”和 AI 原生服务的想法在过去几年里越来越受欢迎,但随着模型在更长视距的智能体任务上变得越来越好,我们现在开始看到第一波这类公司真正突围。
在各种服务类别(如法律、保险、会计、客户支持、招聘和 IT 现代化)中,有许多这种 AI 原生服务业务的例子,其中极端版本是“卷起并叠加 AI(roll-up and layer on AI)”的方法。在从头开始(de-novo)的 AI 原生服务业务方面,我们看到了以下公司:
- Crosby AI 结合了软件、AI 和律师,在联合创始人兼首席执行官 Ryan 称之为“新律所(Neofirm)”的模式中,拥有更多交付的结果。
- WithCoverage 和 Harper 正在构建 AI 原生的保险经纪业务
- Mechanical Orchard 是一家 AI 原生软件现代化服务公司
AI 很棒,但它还不能 100% 解决问题,而一家拥有最终结果的公司既可以填补所有缺失地方的空白,既有动力不断改进,又让客户不必考虑最后一英里的问题。
这条路径特别有趣,因为它最终可能会吸收更多的技术栈。从应用程序加服务开始的东西,随着时间的推移,很可能也会对专业模型进行训练后处理(post-train)。随着 AI 完成更多的工作,这些公司中的一些可能最终会首先拥有两层,然后越来越多地拥有所有三层。
3. 结语
我认为 AI 应用公司不会倾向于仅仅停留在 AI 应用公司的状态。随着时间的推移,它们将进行垂直整合。许多公司将利用他们的轨迹数据来拥有智能,以增加差异化、提高性能并降低成本,特别是考虑到模型公司本身正在侵蚀他们的一些应用程序。其他公司要么从一开始就交付完整的结果,要么随着时间的推移,当他们能做越来越多的工作时,他们会决定,通过销售完整的服务而不是销售只完成 90% 工作的智能体,他们可以捕获更多的价值。
有关此主题的更多相关内容,这里有一些好文章:
- Ryan Daniels (Crosby AI) 关于新律所的崛起 (Rise of the Neofirm)
- Cursor 的 Composer 2 技术报告
- Eoghan McCabe (Intercom) 关于垂直化模型的时代 (Age of Verticalized Models)
- Chris Dixon 关于全栈初创公司 (Full-stack Startups) 的原创文章
我意识到,根据三层技术栈的定义,这两种方法都不是严格意义上的“全栈”:)