Trajectory 融资 1500 万美元:当 AI 模型一旦训练完成就开始「变蠢」,这家汇聚 Jeff Dean、李飞飞押注的公司想让智能体永远不停止学习
全球大模型竞赛有一个没人愿意大声说出来的秘密:你花费数百万美元训练的 AI 模型,在它上线的那一刻,就已经开始落后于现实了。
GPT-4o 的知识截止到 2024 年某月,Claude 的截止到另一个月。即便是「实时联网」的模型,它的核心推理能力也是固定的——它不会因为用户昨天的一万次纠错而变得更聪明,不会因为你的产品在特定行业的使用场景而产生专业化的领域优势。这就是 AI 行业普遍存在的「静态模型瓶颈」(Static Model Bottleneck):模型训练完成后即固化,而现实世界的需求在每一分钟都在变化。
2026 年 5 月,专注于解决这一问题的研究型公司 Trajectory 宣布完成 1500 万美元种子轮融资,估值达 1.15 亿美元(post-money)。本轮由 Conviction 领投,Bessemer Venture Partners、Radical Ventures、BoxGroup 参投,Jeff Dean(Google DeepMind 首席科学家)和 李飞飞(Stanford AI Lab 创始人、World Labs CEO)作为天使投资人参与。公司于 2025 年由 Ronak Malde(CEO)、Michael Elabd 和 Arjun Karanam 联合创立,团队成员来自 Google DeepMind、OpenAI、Apple、Meta Superintelligence Labs、Amazon AGI 和 Scale AI。
| 关键信息 | 内容 |
|---|---|
| 公司名称 | Trajectory |
| 成立时间 | 2025 年 |
| 融资轮次 | 种子轮 |
| 融资金额 | 1500 万美元 |
| 估值 | 1.15 亿美元(post-money) |
| 领投方 | Conviction |
| 参投方 | Bessemer Venture Partners, Radical Ventures, BoxGroup |
| 天使投资人 | Jeff Dean(Google DeepMind)、李飞飞(Stanford / World Labs) |
| 联合创始人 | Ronak Malde(CEO), Michael Elabd(前 Google DeepMind 机器人部门), Arjun Karanam(前 Apple,参与 Vision Pro 研发) |
| 团队背景 | Google DeepMind, OpenAI, Apple, Meta Superintelligence Labs, Amazon AGI, Scale AI, Stripe, Figma |
| 核心产品 | 持续学习平台(Continual Learning Platform),用于大规模智能体模型的连续训练 |
| 核心技术 | 并发多 LoRA 训练栈(Concurrent Multi-LoRA Training Stack) |
| 设计合作伙伴 | Clay, Harvey, Decagon, Mercor, Rogo |
静态模型的诅咒:AI 行业的「灵魂困境」
要理解 Trajectory 在解决什么问题,需要先理解 AI 产品的生命周期里一个几乎被所有人回避的环节。
一家 AI 原生公司(AI-native company)通常的产品开发流程是:选择一个基础模型(GPT-4o、Claude、Gemini 或开源模型)→ 在自有数据上微调或 RAG → 上线产品 → 收集用户反馈。到这里,绝大多数公司会停下来——用户反馈被归档进工单系统,或者每隔几个月才触发一次人工评估和模型更新迭代。
这个间歇性的、不连续的训练周期,就是静态模型瓶颈的根源。
在这个框架下,用户每一次对 AI 的纠错(correction)、重试(retry)、编辑(edit)、反馈(feedback),都是极其宝贵的真实世界学习信号——它告诉模型「这个答案是错的」「在这个具体场景下你应该这样回应」「这位用户有这样的偏好」。但这些信号在绝大多数 AI 产品中,都在沉默中流失。
一个极端但现实的例子:Harvey(Trajectory 的设计合作伙伴,AI 法律助理独角兽,估值超过 30 亿美元)服务的是全球顶级律师事务所。当一名合伙人级律师对 Harvey 的合同审查结果做出修改,这个修改本身包含着极高价值的专业判断——一个顶级并购律师的修订,价值堪比数十万美元的专业咨询。但如果这个信号没有被捕获并反馈到模型训练,Harvey 在下一次面对类似合同时,仍然会犯同样的错误。
Trajectory 的核心假设是:AI 产品竞争的终局,不是谁拥有最大的基础模型,而是谁的模型在特定任务上学得最快、学得最深。 企业级 AI 客户真正想要的,是一个随着使用而持续进化的专属 AI,而不是一个永远停留在训练截止日期的静态系统。
技术架构:多 LoRA 并发训练栈如何实现「不停机学习」
Trajectory 的技术差异化,集中在一个关键突破:并发多 LoRA 训练栈(Concurrent Multi-LoRA Training Stack)。
LoRA(Low-Rank Adaptation) 是大语言模型微调的主流技术之一,其核心思想是:不需要更新整个模型的数十亿参数,只需要对模型的特定层添加小型的低秩矩阵(adapter),就可以以极低的计算成本实现模型在特定任务上的专业化。LoRA 的代价小、速度快,是企业级模型定制的首选方案。
但传统的 LoRA 微调仍然是批次式的(batch-based)——需要先积累一批训练数据,然后触发一次训练,然后部署新版本,然后再积累下一批……这仍然是间歇性的训练循环,不是真正的「持续学习」。
Trajectory 的技术突破在于:让多个 LoRA 适配器可以并发、实时地进行训练,而不影响现有模型的线上服务。这意味着:
– 用户每次对 AI 输出的纠错,立即触发一个针对该类型错误的 LoRA 更新过程;
– 多个并发的 LoRA 实验可以同时在云端进行,无需等待前一批次完成;
– 新的 LoRA 版本经过验证后,可以无缝切换到线上模型,用户几乎感知不到更新;
– 整个过程的实验吞吐量(experiment throughput)据报道有显著提升。
用一个类比来理解这个架构:传统模型更新就像大型操作系统版本发布——每年一两次,每次需要停机安装,更新后可能引入新的 bug。而 Trajectory 做的,是 AI 版本的「滚动更新」(Rolling Update)——像 Chrome 浏览器一样,用户甚至不需要知道后台发生了什么,模型就已经在不断变好。
谁在用它:五个最能验证价值主张的早期客户
Trajectory 的设计合作伙伴选择,本身就是一份极有价值的市场信号读取清单:
| 客户 | 领域 | 为什么需要持续学习 |
|---|---|---|
| Clay | AI 驱动 GTM / 销售情报 | 每个销售代表的沟通风格、目标客户画像、最佳触达时机都不同,需要从真实结果中持续优化 |
| Harvey | AI 法律助理 | 不同律所、不同合伙人的法律判断标准差异巨大,专业纠错信号价值极高 |
| Decagon | AI 客服智能体 | 每个企业客户的产品特性、常见问题、处理规则不同,持续从解决成功/失败案例中学习 |
| Mercor | AI 招聘匹配平台 | 每个公司的人才标准、面试偏好、文化适配度是高度个性化的私有知识 |
| Rogo | AI 金融研究 | 金融分析方法论、行业框架、估值偏好,随分析师和机构文化而千差万别 |
这五个客户有一个共同特征:它们都在高度专业化的垂直领域中,部署面向真实用户的 AI 智能体——在这些场景中,「通用大模型的能力」远不如「在该领域从真实使用中持续进化的专属模型」更有竞争力。
天使投资人:Jeff Dean 和李飞飞的押注信号
个人投资者的选择,往往比机构 VC 更能揭示技术本质。Jeff Dean 和李飞飞同时参与这笔种子轮,是一个值得深入解读的信号。
Jeff Dean 是 Google Brain 和 Google DeepMind 的核心创始人之一,主导了 TensorFlow、TPU 和大量深度学习基础设施的创建。他在 AI 训练基础设施领域的判断力无可置疑。他押注 Trajectory,说明他认为:持续学习的基础设施,是下一代 AI 应用的技术前提,而不只是一个 nice-to-have 功能。
李飞飞 是 ImageNet 的创造者、计算机视觉现代发展的奠基人,同时是 World Labs 的 CEO——World Labs 专注于构建具备空间智能(Spatial Intelligence)的 AI 系统。她对 Trajectory 的押注,反映了一个更深的洞察:持续学习是 AI 从「感知工具」进化为「行动智能体」的必要条件——一个能在真实世界中持续行动、并从行动结果中不断学习的系统,才是真正意义上的 AI 智能体。
竞争格局:持续学习领域的技术路线对比
| 公司 / 方案 | 定位 | 训练方式 | 目标客户 | 劣势 |
|---|---|---|---|---|
| Trajectory | 持续学习平台 | 并发多 LoRA 实时更新 | AI 原生产品公司 | 尚在早期,产品成熟度待验证 |
| Weights & Biases | ML 实验跟踪 | 人工触发批次微调 | 所有 ML 团队 | 不提供自动化持续训练 |
| Scale AI | 数据标注 + 微调 | 人工标注 + 批次训练 | 大型企业 | 成本高、周期长、非实时 |
| Hugging Face AutoTrain | 自动微调工具 | 批次微调 | 开发者 | 不支持智能体场景的持续学习 |
| OpenAI Fine-tuning API | 模型微调服务 | 批次微调 | OpenAI 客户 | 仅限 OpenAI 模型,非实时 |
| 自建 MLOps 流水线 | 企业内部方案 | 定制化 | 大型科技公司 | 工程成本极高,非中小企业可承受 |
Trajectory 的差异化定位在于:它是目前唯一专注于「实时、持续、产品内嵌」的智能体模型训练平台,其他方案要么太手动、要么太昂贵、要么不是为智能体场景而设计的。
Conviction 的领投逻辑:为什么是持续学习,为什么是现在
Conviction 是 Sarah Guo 创立的 AI 专注型 VC,其投资逻辑高度聚焦在「AI 基础设施」和「AI 应用」的交汇地带。Conviction 的投资组合包括多家 AI 工具和基础设施公司,领投 Trajectory 的种子轮,是 Conviction 对一个核心命题的押注:
2025-2030 年,AI 原生公司之间的竞争,将越来越多地体现在「模型进化速度」上,而不只是初始模型能力。 当所有公司都可以通过 API 调用 GPT-4o 或 Claude 获得相似的基础能力,真正拉开差距的将是:谁能让自己的模型在特定任务上比竞争对手学得更快。
Bessemer Venture Partners 和 Radical Ventures 的共同参投,也进一步强化了这个信号——这两家 VC 在过去 12 个月都在从传统 SaaS 投资向 AI 基础设施倾斜。
关键风险与挑战
1. 「持续学习」的工程复杂度远超预期。 实时更新一个正在线上提供服务的 AI 模型,在工程上极其复杂:如何防止「灾难性遗忘」(catastrophic forgetting,新训练覆盖旧知识)?如何确保并发的 LoRA 更新不会相互干扰?如何在实时训练中保证模型的安全性和对齐性?这些都是尚未完全解决的研究问题,Trajectory 需要同时扮演「研究机构」和「产品公司」两种角色。
2. 数据飞轮的冷启动问题。 持续学习平台的价值,随着客户部署时间的增长而增长——一个用了 Trajectory 半年的 AI 产品,比刚开始用的产品拥有更多学习信号、更强的专业化能力。但对于刚刚接入的新客户,初期的价值体现可能不明显,这对销售和客户成功提出了很高的要求。
3. 大型基础模型提供商的「功能内化」风险。 如果 OpenAI、Anthropic 或 Google 决定将「持续学习」作为其 API 的标准功能推出,Trajectory 的独立平台价值将被直接压缩。目前 OpenAI 已有批次微调 API,Anthropic 也在测试类似功能——这个竞争风险是真实的。
4. 安全与合规的挑战。 让模型从用户行为中持续学习,意味着用户数据(包括用户的纠错、编辑)会成为训练数据。在 GDPR、HIPAA 等数据隐私法规日趋严格的环境中,Trajectory 需要为客户提供清晰的数据治理框架,否则企业客户(特别是金融、法律、医疗领域)将难以接受这种数据处理方式。
5. 1500 万美元的种子资金能支撑多久的研究+产品双轨道? 持续学习研究是高度资本密集型的——大规模实验需要大量 GPU 算力,而产品开发需要工程人才。$15M 的种子轮对于一家「研究型+产品型」公司来说,runway 有限。下一轮融资的时间压力相当大。
Trajectory 的赌注,建立在一个关于 AI 产业演进的深刻判断上:AI 时代的竞争优势,不来自于你训练了什么,而来自于你持续学习了什么。过去十年,互联网公司的竞争壁垒是数据量和用户数量;未来十年,AI 原生公司的竞争壁垒,将是模型从用户行为中学习的速度和质量。Jeff Dean 和李飞飞押注这家成立不到一年的公司,是因为他们相信:让 AI 学会不停止学习,是整个行业下一个最重要的技术命题。 而 Trajectory,可能是这个命题最早的、也是目前最认真的解题者。