AI 中的分发与数据飞轮
本文信息来源:akashbajwa
推出最小可行质量版本以赢得市场
随着 Anthropic 切断 Windsurf 对其模型的访问 ,AI 领域的垂直整合再度成为热点话题。
我半年前关于垂直整合的核心观点依然成立——最佳产品会获得分销渠道,从而积累数据反哺产品改进。
搜索与数据飞轮
Cursor 公司 CEO 迈克尔·特鲁埃尔将这种动态比作互联网早期的搜索市场。
本·汤普森: 这对你们而言是否构成真正的可持续优势?凭借用户数据,你们不仅能调用 LLM 起步,更能基于 Cursor 用户数据训练自有模型,从而真正主导这个领域。最初你们掌握了完整的代码上下文——这是实现目标的首要条件,如今更拥有了专属的训练数据。
迈克尔·特鲁埃尔: 是的,我认为这是个巨大优势。这种高上限的动态机制让你可以在产品间进行选择,而第三种分销动态则能获取数据,进而帮助优化产品。我认为搜索引擎在 90 年代末和 21 世纪初就同时具备这三种特性,因此在很多方面, 我们市场的竞争动态其实更接近搜索引擎,而非普通的企业软件市场。
基于用户行为数据的强化学习,其价值等同于 AI 领域的网络效应。
事实上,拥有能聚合或收集用户行为的产品极具价值,因为这最终会成为最重要的数据集。 由此产生的一个有趣推论是: 掌握用户数据的 AI 初创公司可以通过强化学习定制模型 ,而无需耗费大量算力来合成数据。
Anthropic 深知这种动态最终会对 OpenAI 有利(自其收购 Windsurf 以来)——以下是联合创始人 Ben Mann 的看法:
从传统初创企业创始人对重要性的理解来看,我认为代码编写作为一种应用场景,不能完全交由客户自行处理。我们非常珍视像 Cursor 和 GitHub 这样的合作伙伴,他们大量使用了我们的模型,但如果我们不直接与编程用户建立联系,我们所能获取的知识量和学习速度都会大打折扣。
Anthropic 需要像 Cursor 这样的客户带来的收入,但最终面临的风险是 Cursor 凭借其数据优势会逐渐将其完全商品化。目前双方尚可共存,但从长远来看,正面竞争将不可避免。Windsurf 的案例则更为清晰明了。
如果 AI 市场的竞争动态更接近搜索引擎而非传统企业软件,这将带来多重影响。
分发能力 > 技术实力
在 AI 领域创业迫使创始人必须同时秉持两种相悖的理念。
一方面,AI 代表着平台级变革,这种变革往往会使市场份额流向那些从第一性原理重建产品的新兴厂商。
另一方面,如果分销渠道能带来数据,进而催生更优质的产品,那么现有巨头岂不是注定胜出?
关键在于最低可行质量的平衡点
OpenAI 和 ChatGPT 相对于消费互联网巨头的迅速崛起印证了这一点。
2022 年 10 月发布的 ChatGPT 版本功能简单。然而,正是作为产品的 ChatGPT 与作为 API 的 GPT-3 之间的差异,推动了当前人工智能浪潮的爆发。
人们热议速度并非没有原因。
快速迭代的公司深谙:以最小可行质量标准频繁发布功能,比采用「 臃肿创业 」模式更有利于赢得市场份额并形成数据飞轮。
帕特里克·奥肖内西在 2020 年采访拉胡尔·沃拉时,就 Superhuman 产品背景下如何权衡这一问题向他提问:
PS:科技创业领域我最钟爱的辩论之一,是关于精益模式(通过大量迭代试错和用户反馈学习)与基思·拉博伊斯电影制片模式(就像你们采用的做法——像拍摄电影般投入长期巨大努力,有演员、剧本等全套准备,最终推出惊艳产品而非群体迭代产物)之间的争论。
RV:
需要说明的是,2015年夏季我们像其他软件公司一样从编写代码起步。2016年夏季我们仍在编码,2017年夏季依旧如此。当时我感受到无比强烈的发布压力。
当时已经过去两年,我们仍未正式发布产品。但内心深处我明白,无论承受多大压力,仓促发布只会适得其反。我确信我们的产品尚未达到市场契合点。
于是在 2017 年 4 月,我开始了寻找"圣杯"的征程——既要明确定义产品市场契合的标准,又要建立量化评估的指标,更要形成系统提升契合度的方法论。正是这番探索让我构建出广为人知的产品市场契合引擎,它本质上是精益创业模式与 Keith Rabois 提出的"厚重创业"模式(或称电影制片模式)的融合体。
实际上我对这两种观点都深信不疑,我认为我们处于中间立场。我会说,前期要筹集大量资金。我会建议,尽可能做出长远决策。我要强调, 不要推出最小可行产品,而要推出极致愉悦的产品。 但我也要说,必须密切关注用户反馈。
在当今 AI 领域的发展速度和工程生产力水平下,Superhuman 的方法还能奏效吗?恐怕不行。
企业软件的经典防御性要素向来是系统集成和转换成本。但如果 AI 应用更像搜索引擎,那么成为终端用户花费数小时完成工作的客户端,就是 AI 技术栈中最具价值的位置。
Librechat 与客户端的未来
LibreChat 是 ChatGPT 的开源替代方案,目前正作为当日最热门代码库位列榜首。


开发者能够使用多模型路由、智能代理、代码解释器、工具调用以及日益完善的企业级功能 (例如身份验证、单点登录等),像 Shopify 这样的公司正通过分叉 LibreChat 并向上游合并改进方案,积极推动其发展。
我们先前讨论的飞轮效应取决于终端用户及其行为数据的归属权。
LibreChat 可能瓦解企业客户对 ChatGPT 和 Claude 等平台的依赖,助力企业建立专属数据飞轮。
当企业能构建正确的强化学习环境时,定制化模型时代才具现实意义。相比基础模型的迅猛发展,针对企业的微调模型普遍未能奏效。
将其投入生产环境,开启完整日志记录,你就拥有了与 Claude、Cursor 和 ChatGPT 等客户正在追逐的专有数据飞轮相同的基础设施,只不过你的飞轮是针对企业所在的具体领域构建的。
在后多窗格计算(MCP)时代尤其如此——用户减少应用切换时间,更多工作都在单一界面中完成。
这将导致企业采用更多小型语言模型,减少 ChatGPT 席位,并使 API 调用更均衡地分布在不同的模型之间。
目前 LibreChat 仅威胁到具有简单聊天界面的客户端。但随着时间的推移,它们也可能开始侵蚀嵌入工作流程的其他客户端。随着更多企业开发自己的内部分支版本,这种趋势很可能会加速到来。
数据



