美国的开源模型在哪里？

美国的开源模型在哪里？

在我几乎整个风险投资生涯中，我一直在投资开源公司。我热爱开源企业，认为它们通常对整个生态系统大有裨益，也能够创造巨大的商业价值（不过这并不容易！）。我们已经看到各种类型的开源企业取得成功，比如数据库（Mongo、Clickhouse 等）、数据基础设施（Databricks、Confluent 等）、开发者工具（Hashicorp、GitLab 等），以及许多其他类别。

其中的微妙之处在于，你如何定义“开源”。这在很大程度上取决于开源项目采用的是什么开源许可证。总体来看，主要可分为三大类。第一类是完全开放且宽松的许可证（MIT、Apache 2.0 等）——任何人都可以按自己的意愿使用、修改和分发代码，包括在其基础上构建商业产品。第二类是 copyleft（GPL、AGPL 等）——代码是开放的，但如果你分发它或在其基础上开发，就必须把你自己的代码也开源。第三类是 source available——代码可公开阅读，但许可证会以特定方式限制商业用途。这类许可证包括 BSL（Business Source License）和 SSPL，HashiCorp 和 MongoDB 都曾在不同时期转向采用这类许可证。 source available 许可证的核心在于，除了项目变现之外，你基本可以做宽松许可证下能做的所有事情（也就是说，你不能拿这个项目做一个托管版本，然后向用户收费）。最“纯粹”的开源支持者会认为，只有完全开放且宽松的许可证才是真正的开源，其他都不是。

这些开源公司的打法过去是、现在仍然是：先成为各自领域的默认选择。这是最关键的一步。Spark 成为了大规模数据处理领域的默认方案，Kafka 成为了实时数据流处理和事件摄取领域的默认方案，Mongo 成为了 NoSQL 数据库领域的默认方案，等等。每个项目都在各自领域获得了广泛采用、几乎无处不在——它们曾经是、现在仍然是各自应用场景中的主导平台。随后，这些项目背后的商业公司再想办法实现变现。有时是通过托管服务——由公司代你运行和管理基础设施，这样你就无需自己操心项目的部署、扩展或维护。在其他情况下，专有功能则被置于商业版本之后（例如更好的性能、企业级功能等）。无论如何，行业中始终存在清晰的变现路径，也已有许多成功案例证明，围绕成功的开源项目之上可以建立起规模可观的商业企业。

但情况并非一直如此。很长一段时间里，业内的传统看法是，开源不可能成为一门真正的生意。代码既然是免费的，那谁来买单？而这种怀疑并非空穴来风——一家公司为什么要为某种东西付费，而他们自己的工程师明明可以直接下载并自行运行？早期的开源公司不得不艰难地证明其商业模式成立，许多投资人一开始也放弃了这类交易，因为其中的商业逻辑并不显而易见。“你们这是要直接白送出去？”是很常见的反应。坦率地说，这也并不是一个不合理的问题。最终的答案是：没错，软件本身可以免费提供，但你可以围绕它的一切收费——托管版本、企业级功能、支持、集成、专有引擎等等。开源项目承担的是分发渠道的角色，而商业化产品则是另一回事。随着一批成功的开源商业公司出现，市场才越来越清楚地看到其中在商业上的可能性。而这也至关重要——投资人（包括我自己）曾深信，成功的开源项目可以转化为成功的商业公司。这形成了一套重要的激励机制——投资者有动力为开源公司提供资金，创始人也有动力创办商业化开源公司

让我把这和开源 AI 领域正在发生的事情联系起来。如今，最大的失望之一，是美国缺乏一个强有力的开源模型生态。所有前沿模型都来自 OpenAI / Anthropic 的闭源体系。领先的开源模型则几乎全部出自中国实验室。DeepSeek 是最突出的例子，此外还有 Alibaba 的 Qwen、Moonshot AI 的 Kimi 等。Jensen Huang 曾谈到，在 AI 技术栈的每一层——芯片、模型、基础设施、应用——都拥有美国领导者的重要性。美国显然在芯片领域占据领先地位（NVIDIA），在应用层也拥有强大的既有企业，但开源模型这一层却是一个明显短板。而这一短板的重要性，远超许多人的认知。开源模型是开发者学习、实验和构建的基础。它们是下一代 AI 应用的分发层。如果占主导地位的开源模型都来自中国实验室，这将对开发者社区在哪里形成、工具链围绕哪里构建，以及最终商业生态在何处兴起，产生长期影响。

那么，为什么美国开源模型生态没有出现更繁荣的发展？我认为归根结底还是激励机制的问题。就像很多年前投资者曾对开源公司的商业模式存疑一样，如今他们对开源实验室也有类似的疑问。开源模型要如何实现商业化？你可以“托管”它——对于模型而言，这大概就是提供一个可供用户调用、用于推理的 API 端点。<p> 但如果你这样做，你也将直接与任何能够拿起你的模型并托管推理 API 端点的人竞争。Baseten、Fireworks、各大超大规模云厂商等等。于是问题就变成了：作为模型提供方，你是否拥有某种优势，能够以更高性能或更低成本（或两者兼具）来提供该模型服务。这个问题的答案很可能是“也许有”，但这种优势恐怕不足以让你在长期内以高利润率胜出。</p>

下一个顺理成章的方向是进入微调/评估反馈闭环。大多数人都希望拿一个开源模型，针对自己的使用场景/数据进行微调，并对这个微调后的模型进行观察/监控/改进（如此循环往复）。因此，开源实验室可以进入这条业务线并为此收费。但即便如此，你仍将与 Fireworks、Baseten 以及同样会提供这类服务的 Hyperscalers 展开竞争。

接下来还有一个问题：究竟怎样才算是开源模型？实际上，这里同样存在一个光谱，而且与我们前面谈到的许可证分类基本可以一一对应。在模型世界里，与 MIT/Apache 相当的，是那种真正开放权重且没有商业限制的模型——你可以下载、微调、托管、在其之上开展业务，想怎么用都行。与“源代码可用”相对应的，则更像是 LLaMA——权重是公开可获得的，你可以进行实验和开发，但一旦达到一定规模，就会触发商业限制。而真正意义上的开源，也就是相当于发布完整源代码，则意味着不仅要公开权重，还要公开训练数据、训练流程、评测体系，以及从零完整复现该模型所需的一切。几乎没有人这么做。因此，当我们谈论“开源模型生态”时，实际上大多是在谈论开放权重模型，只是它们附带的商业限制程度各不相同。这很重要，因为正如“源码可用”许可证改变了传统开源公司的商业格局一样，开放权重模型中内置的限制将决定开发者社区在哪里形成、上层会构建出什么，以及最终由谁攫取商业价值。

我认为，当前开源模型生态面临的主要问题是激励机制。人们（也就是投资者）对开源模型的商业可行性提出质疑。如今，世界上大多数人在各种场景中都在使用前沿模型。然而，最近真正进入焦点的是成本问题。开着法拉利去街上杂货店买东西，实在说不过去……本田就完全够用了。你并不需要在所有事情上都使用“昂贵的前沿”tokens。我不知道这条界线具体在哪里，但我们不妨套用一下二八法则。也许 80%的使用场景都足够通用，用一个更小、能力稍弱但成本效率更高的模型就能很好地完成。而在另外 20%的使用场景中，你才真正需要那些昂贵的前沿 tokens（这个比例完全是我随口举的，只是为了说明问题）。

那么——为什么开源不应该在这一轮周期的下一阶段占据主导地位呢？？当人们把使用从最昂贵的 token 转向更便宜的 token 时，开源难道不应成为自然而然的替代选择吗？是的——但模型在哪里？？另一个根深蒂固的假设是，开源模型已经“足够好”。换句话说，前沿闭源模型与开源模型之间的差距并没有“那么大”（更重要的是，这一差距的走势究竟是在扩大还是在缩小）。

目前，所有最好的开源模型都是中国模型……而且这些模型之所以能取得如今的水平，很大程度上是通过蒸馏前沿模型实现的。但我认为，当模型还更接近“基础型”语言模型时，这要容易得多。那时主要是问答型模型，你可以通过向前沿模型提出数百万个问题来构建一个数据集。我认为，蒸馏正变得越来越难。最前沿的模型如今正以越来越复杂的框架发布。或者，前沿模型并不是通过 API 发布，而是被直接封装成产品。再看看 Claude——在使用 Claude Code 的过程中，我有一些工作流会并行启动 50 多个智能体。你要如何蒸馏一个有 50 多个智能体并行运行的模型？？这可比仅仅获得数百万组问答对难多了…… 所有这一切都使“蒸馏”变得困难得多。而预训练的成本（在没有蒸馏带来的先发优势情况下）极其高昂。归根结底，我现在大概更倾向于认为，前沿模型与开源模型之间的差距正在扩大，而不是缩小。

那么，究竟谁有能力筹集巨额资金来预训练一个模型——这个模型或许能用，但也可能最终落后于前沿太多，难以真正抢占市场份额；而即便前面这些问题都处理得当，长期如何实现商业化变现仍然存疑（见本文前半部分）。每个人都希望这件事发生。但谁会为此买单？

我回想起 Neoclouds 的早期阶段，那时 NVIDIA 的确撑起了整个生态。他们为一批原本可能无法从其他渠道获得资金支持的公司提供了大量资助。我们是否又需要“国王” Jensen 出手？？还是需要政府出于国家主权利益来提供资金支持？？我也不确定。但我真心希望，美国的开源生态系统能够找到一条繁荣发展的道路。

我认为，真正需要的是某种由开源率先取得的研究突破。希望这会发生！我也认为——并无内幕消息——在某个时点，闭源的前沿实验室会重新开始开源模型。或许不是最前沿的模型。或许是前沿模型的精简版，或者将比最前沿版本早一个发布周期的模型开源。这是最值得期待的情景！

季度财报摘要

电动汽车企业前瞻十二个月营收倍数前十名

每周股价涨跌幅前十名

估值倍数更新

SaaS 企业的估值通常是其营收的一定倍数——多数情况下，采用未来 12 个月的预期营收。营收倍数是一种简化的估值框架。鉴于大多数软件公司尚未实现盈利，或尚未产生有意义的自由现金流（FCF），这也是衡量整个行业最具可比性的指标。即便是贴现现金流模型（DCF），也充满了对长期的假设。SaaS 的逻辑在于，早期的增长会在成熟阶段转化为利润。下方所示的倍数，是以企业价值（市值 + 债务 – 现金）除以未来 12 个月营收（NTM revenue）计算得出。

总体统计：

总体中位数：3.4倍
前五名中位数：28.9倍
10年期：4.5%

按增长分组。在下列分组中，我将预计未来 12 个月（NTM）增长超过 22%视为高增长，15%-22%为中增长，低于 15%为低增长。我不得不调整“高增长”的划分标准。如果 22%看起来有些武断，那是因为它确实如此……我只是选了一个分界点，使高增长组中有~10 家公司符合条件，从而让样本规模在统计上更具意义

高增长中位数：16.3倍
中等增长中位数：5.0倍
低增长中位数：3.0倍

企业价值 / 未来12个月营收 / 未来12个月增长率

下图显示的是企业价值/未来 12 个月营收倍数（EV / NTM revenue multiple）除以未来 12 个月市场一致预期增长率后的结果。因此，一家按未来 12 个月营收 20 倍交易、且预计增长 100%的公司，其对应数值将为 0.2 倍。该图的目的是展示，相对于各自的增长预期，每只股票的估值究竟是相对便宜还是昂贵。

企业价值 / 未来十二个月自由现金流

这张折线图显示了所有自由现金流（FCF）倍数大于 0 倍且小于 100 倍公司的中位数。我选取这一子集，是为了展示那些以自由现金流作为相关估值指标的公司。

NTM 自由现金流为负的公司未列入图表中

EV / NTM 营收倍数与 NTM 营收增长的散点图

增长与估值倍数的相关性有多强？

运营指标

未来12个月营收增长率中位数：12%
过去12个月营收增长率中位数：16%
毛利率中位数：76%
营业利润率中位数：2%
自由现金流利润率中位数：21%
净收入留存率中位数：110%
客户获取成本回收期中位数：42个月
销售与营销费用占收入比例中位数：34%
研发支出占营收比例中位数：23%
行政与一般费用占收入中位数：13%

可比公司输出

40 法则显示收入增长率 + 自由现金流利润率（增长率和利润率均采用 LTM 和 NTM 口径）。自由现金流计算方式为：经营活动产生的现金流量 – 资本支出

毛利调整后回收期的计算公式为：（上一季度销售与营销费用）/（季度新增净 ARR × 毛利率）× 12。该指标显示一家 SaaS 企业在毛利润基础上收回其完全摊销客户获取成本（CAC）所需的月数。大多数上市公司并不披露季度新增净 ARR，因此我采用推算 ARR 指标（季度订阅收入 × 4）。季度新增净 ARR 即当季 ARR 减去上一季度 ARR。未披露订阅收入的公司未被纳入分析，并列为 NA。

本文使用的消息来源包括 Bloomberg、Pitchbook 以及公司文件

本通讯中呈现的信息仅代表作者个人观点，不一定反映任何其他个人或实体的立场，包括 Altimeter Capital Management, LP（“Altimeter”）。所提供的信息被认为来自可靠来源，但对任何不准确之处概不承担责任。本文仅供参考，不应被视为投资建议。过往业绩并不保证未来表现。Altimeter 是一家在美国证券交易委员会注册的投资顾问。注册并不意味着具备某一特定水平的技能或培训。Altimeter 及其客户交易公开证券，并且已经作出及／或可能作出与本文提及公司相关的投资或投资决策。本文所表达的观点仅代表作者本人，不代表 Altimeter 或其客户；后者保留作出投资决策或进行交易活动的权利，而该等决策或活动可能与本文所表达的观点一致，也可能被视为与其不一致。

本帖及所提供的信息仅供参考。 本文所表达的观点仅代表作者本人，并不构成出售任何证券的要约、购买任何证券的建议或购买要约邀请，也不构成对任何投资产品或服务的推荐。尽管本文所载部分信息取自被认为可靠的来源，但作者本人及其任何雇主或其关联方均未对该等信息进行独立核实，因此无法保证其准确性和完整性。因此，对于该等信息的公正性、准确性、时效性或完整性，不作任何明示或暗示的声明或担保，亦不应据此加以依赖。作者及其所有雇主和关联人士对该等信息不承担任何责任，且不承担在未来更新本文所含信息或分析的任何义务。