Baseten 融资10亿美元估值110亿:AI推理基础设施的AWS时刻来了
如果说2024年是大模型训练的军备竞赛之年,那么2026年正在成为AI推理基础设施的爆发之年。Baseten——一家为开发者提供模型推理部署服务的平台公司——正在洽谈一笔10亿美元的融资,估值将达到110亿美元,仅三个月前其估值还是50亿美元。这意味着,在短短90天内,这家公司的估值翻了一倍以上。
| 项目 | 详情 |
|---|---|
| 公司名称 | Baseten |
| 总部 | 美国旧金山 |
| 定位 | AI推理基础设施平台(AWS for Inference) |
| 融资金额 | 10亿美元(洽谈中) |
| 估值 | 110亿美元 |
| 上一轮 | 2026年1月 E轮 3亿美元,估值50亿美元 |
| 更早一轮 | 2025年9月 D轮,估值21.5亿美元 |
| 年化收入 | 约6亿美元(2026年Q1末) |
| 核心客户 | Notion, Cursor, Writer, HeyGen |
推理经济学:AI行业的下半场
在AI生态中,训练和推理是两个截然不同的计算问题。训练是一次性投入巨量算力教会模型,而推理是每次用户请求时模型思考并回答的过程。随着AI应用从实验室走向生产环境,推理计算量正在以指数级增长——Baseten预计到2026年底,推理将占所有AI计算需求的三分之二。
Baseten 定位为推理领域的AWS,为开发者提供运行、训练和定制机器学习模型的基础设施。与直接使用云厂商(AWS/GCP/Azure)的原始GPU实例相比,Baseten提供了更高层次的抽象,让开发者无需关心底层GPU调度、模型优化和扩缩容的复杂性。其客户群体画像非常清晰:AI原生的高速增长公司——Notion、Cursor、Writer、HeyGen——这些公司对推理延迟、成本和可靠性有极致要求。
估值火箭:从21.5亿到110亿的8个月
Baseten 的估值增长轨迹堪称疯狂:
- 2025年9月:D轮融资,估值21.5亿美元
- 2026年1月:E轮融资3亿美元,估值50亿美元(4个月翻倍)
- 2026年5月:洽谈10亿美元融资,估值110亿美元(3个月再翻倍)
支撑这一估值飙升的是实打实的收入增长:2026年Q1初年化收入为2亿美元,到Q1末已攀升至约6亿美元——一个季度内收入增长了3倍。这种增速在SaaS/基础设施公司中极为罕见。
竞争格局:推理基础设施的多方博弈
| 玩家 | 定位 | 差异化 |
|---|---|---|
| Baseten | AI推理基础设施平台 | 开发者体验优先,AI原生客户 |
| AWS / GCP / Azure | 通用云计算 | 全栈能力,但推理抽象层较低 |
| Anyscale (Ray) | 分布式计算框架 | 偏底层框架,非托管服务 |
| Modal | 无服务器GPU计算 | 按需GPU,偏通用计算 |
| Replicate | 模型推理API | 偏开源模型部署 |
| Together AI | 开源模型推理 | 开源模型生态 |
⚠️ 风险提示:AI推理基础设施市场虽然增长迅猛,但面临几大不确定性:一是云巨头(AWS/GCP/Azure)随时可能加大推理层投入挤压独立厂商空间;二是模型效率提升(如更小的模型、更高效的量化技术)可能降低推理算力需求;三是110亿美元估值对应约6亿美元年化收入,约18倍PS,隐含了极高的增长预期。
AI推理正在成为互联网基础设施的新一层,而Baseten正试图成为这一层的默认选择。从产品力到收入增速,从客户质量到估值涨幅,Baseten都展现出了一家定义性公司的特征。但110亿美元的估值也意味着市场对其寄予了极高期望——在这个赛道上,增速一旦放缓,估值修正可能同样剧烈。