Trajectory 融资 1500 万美元：当 AI 模型一旦训练完成就开始「变蠢」，这家汇聚 Jeff Dean、李飞飞押注的公司想让智能体永远不停止学习

项目速览

项目名称 Trajectory

融资轮次种子轮

融资金额 $15M

投资方 Conviction, Bessemer Venture Partners, Radical Ven

全球大模型竞赛有一个没人愿意大声说出来的秘密：你花费数百万美元训练的 AI 模型，在它上线的那一刻，就已经开始落后于现实了。

GPT-4o 的知识截止到 2024 年某月，Claude 的截止到另一个月。即便是「实时联网」的模型，它的核心推理能力也是固定的——它不会因为用户昨天的一万次纠错而变得更聪明，不会因为你的产品在特定行业的使用场景而产生专业化的领域优势。这就是 AI 行业普遍存在的「静态模型瓶颈」（Static Model Bottleneck）：模型训练完成后即固化，而现实世界的需求在每一分钟都在变化。

2026 年 5 月，专注于解决这一问题的研究型公司 Trajectory 宣布完成 1500 万美元种子轮融资，估值达 1.15 亿美元（post-money）。本轮由 Conviction 领投，Bessemer Venture Partners、Radical Ventures、BoxGroup 参投，Jeff Dean（Google DeepMind 首席科学家）和 李飞飞（Stanford AI Lab 创始人、World Labs CEO）作为天使投资人参与。公司于 2025 年由 Ronak Malde（CEO）、Michael Elabd 和 Arjun Karanam 联合创立，团队成员来自 Google DeepMind、OpenAI、Apple、Meta Superintelligence Labs、Amazon AGI 和 Scale AI。

关键信息	内容
公司名称	Trajectory
成立时间	2025 年
融资轮次	种子轮
融资金额	1500 万美元
估值	1.15 亿美元（post-money）
领投方	Conviction
参投方	Bessemer Venture Partners, Radical Ventures, BoxGroup
天使投资人	Jeff Dean（Google DeepMind）、李飞飞（Stanford / World Labs）
联合创始人	Ronak Malde（CEO）, Michael Elabd（前 Google DeepMind 机器人部门）, Arjun Karanam（前 Apple，参与 Vision Pro 研发）
团队背景	Google DeepMind, OpenAI, Apple, Meta Superintelligence Labs, Amazon AGI, Scale AI, Stripe, Figma
核心产品	持续学习平台（Continual Learning Platform），用于大规模智能体模型的连续训练
核心技术	并发多 LoRA 训练栈（Concurrent Multi-LoRA Training Stack）
设计合作伙伴	Clay, Harvey, Decagon, Mercor, Rogo

静态模型的诅咒：AI 行业的「灵魂困境」

要理解 Trajectory 在解决什么问题，需要先理解 AI 产品的生命周期里一个几乎被所有人回避的环节。

一家 AI 原生公司（AI-native company）通常的产品开发流程是：选择一个基础模型（GPT-4o、Claude、Gemini 或开源模型）→ 在自有数据上微调或 RAG → 上线产品 → 收集用户反馈。到这里，绝大多数公司会停下来——用户反馈被归档进工单系统，或者每隔几个月才触发一次人工评估和模型更新迭代。

这个间歇性的、不连续的训练周期，就是静态模型瓶颈的根源。

在这个框架下，用户每一次对 AI 的纠错（correction）、重试（retry）、编辑（edit）、反馈（feedback），都是极其宝贵的真实世界学习信号——它告诉模型「这个答案是错的」「在这个具体场景下你应该这样回应」「这位用户有这样的偏好」。但这些信号在绝大多数 AI 产品中，都在沉默中流失。

一个极端但现实的例子：Harvey（Trajectory 的设计合作伙伴，AI 法律助理独角兽，估值超过 30 亿美元）服务的是全球顶级律师事务所。当一名合伙人级律师对 Harvey 的合同审查结果做出修改，这个修改本身包含着极高价值的专业判断——一个顶级并购律师的修订，价值堪比数十万美元的专业咨询。但如果这个信号没有被捕获并反馈到模型训练，Harvey 在下一次面对类似合同时，仍然会犯同样的错误。

Trajectory 的核心假设是：AI 产品竞争的终局，不是谁拥有最大的基础模型，而是谁的模型在特定任务上学得最快、学得最深。 企业级 AI 客户真正想要的，是一个随着使用而持续进化的专属 AI，而不是一个永远停留在训练截止日期的静态系统。

技术架构：多 LoRA 并发训练栈如何实现「不停机学习」

Trajectory 的技术差异化，集中在一个关键突破：并发多 LoRA 训练栈（Concurrent Multi-LoRA Training Stack）。

LoRA（Low-Rank Adaptation） 是大语言模型微调的主流技术之一，其核心思想是：不需要更新整个模型的数十亿参数，只需要对模型的特定层添加小型的低秩矩阵（adapter），就可以以极低的计算成本实现模型在特定任务上的专业化。LoRA 的代价小、速度快，是企业级模型定制的首选方案。

但传统的 LoRA 微调仍然是批次式的（batch-based）——需要先积累一批训练数据，然后触发一次训练，然后部署新版本，然后再积累下一批……这仍然是间歇性的训练循环，不是真正的「持续学习」。

Trajectory 的技术突破在于：让多个 LoRA 适配器可以并发、实时地进行训练，而不影响现有模型的线上服务。这意味着：

用户每次对 AI 输出的纠错，立即触发一个针对该类型错误的 LoRA 更新过程；
多个并发的 LoRA 实验可以同时在云端进行，无需等待前一批次完成；
新的 LoRA 版本经过验证后，可以无缝切换到线上模型，用户几乎感知不到更新；
整个过程的实验吞吐量（experiment throughput）据报道有显著提升。

用一个类比来理解这个架构：传统模型更新就像大型操作系统版本发布——每年一两次，每次需要停机安装，更新后可能引入新的 bug。而 Trajectory 做的，是 AI 版本的「滚动更新」（Rolling Update）——像 Chrome 浏览器一样，用户甚至不需要知道后台发生了什么，模型就已经在不断变好。

谁在用它：五个最能验证价值主张的早期客户

Trajectory 的设计合作伙伴选择，本身就是一份极有价值的市场信号读取清单：

客户	领域	为什么需要持续学习
Clay	AI 驱动 GTM / 销售情报	每个销售代表的沟通风格、目标客户画像、最佳触达时机都不同，需要从真实结果中持续优化
Harvey	AI 法律助理	不同律所、不同合伙人的法律判断标准差异巨大，专业纠错信号价值极高
Decagon	AI 客服智能体	每个企业客户的产品特性、常见问题、处理规则不同，持续从解决成功/失败案例中学习
Mercor	AI 招聘匹配平台	每个公司的人才标准、面试偏好、文化适配度是高度个性化的私有知识
Rogo	AI 金融研究	金融分析方法论、行业框架、估值偏好，随分析师和机构文化而千差万别

这五个客户有一个共同特征：它们都在高度专业化的垂直领域中，部署面向真实用户的 AI 智能体——在这些场景中，「通用大模型的能力」远不如「在该领域从真实使用中持续进化的专属模型」更有竞争力。

天使投资人：Jeff Dean 和李飞飞的押注信号

个人投资者的选择，往往比机构 VC 更能揭示技术本质。Jeff Dean 和李飞飞同时参与这笔种子轮，是一个值得深入解读的信号。

Jeff Dean 是 Google Brain 和 Google DeepMind 的核心创始人之一，主导了 TensorFlow、TPU 和大量深度学习基础设施的创建。他在 AI 训练基础设施领域的判断力无可置疑。他押注 Trajectory，说明他认为：持续学习的基础设施，是下一代 AI 应用的技术前提，而不只是一个 nice-to-have 功能。

李飞飞 是 ImageNet 的创造者、计算机视觉现代发展的奠基人，同时是 World Labs 的 CEO——World Labs 专注于构建具备空间智能（Spatial Intelligence）的 AI 系统。她对 Trajectory 的押注，反映了一个更深的洞察：持续学习是 AI 从「感知工具」进化为「行动智能体」的必要条件——一个能在真实世界中持续行动、并从行动结果中不断学习的系统，才是真正意义上的 AI 智能体。

竞争格局：持续学习领域的技术路线对比

公司 / 方案	定位	训练方式	目标客户	劣势
Trajectory	持续学习平台	并发多 LoRA 实时更新	AI 原生产品公司	尚在早期，产品成熟度待验证
Weights & Biases	ML 实验跟踪	人工触发批次微调	所有 ML 团队	不提供自动化持续训练
Scale AI	数据标注 + 微调	人工标注 + 批次训练	大型企业	成本高、周期长、非实时
Hugging Face AutoTrain	自动微调工具	批次微调	开发者	不支持智能体场景的持续学习
OpenAI Fine-tuning API	模型微调服务	批次微调	OpenAI 客户	仅限 OpenAI 模型，非实时
自建 MLOps 流水线	企业内部方案	定制化	大型科技公司	工程成本极高，非中小企业可承受

Trajectory 的差异化定位在于：它是目前唯一专注于「实时、持续、产品内嵌」的智能体模型训练平台，其他方案要么太手动、要么太昂贵、要么不是为智能体场景而设计的。

Conviction 的领投逻辑：为什么是持续学习，为什么是现在

Conviction 是 Sarah Guo 创立的 AI 专注型 VC，其投资逻辑高度聚焦在「AI 基础设施」和「AI 应用」的交汇地带。Conviction 的投资组合包括多家 AI 工具和基础设施公司，领投 Trajectory 的种子轮，是 Conviction 对一个核心命题的押注：

2025-2030 年，AI 原生公司之间的竞争，将越来越多地体现在「模型进化速度」上，而不只是初始模型能力。 当所有公司都可以通过 API 调用 GPT-4o 或 Claude 获得相似的基础能力，真正拉开差距的将是：谁能让自己的模型在特定任务上比竞争对手学得更快。

Bessemer Venture Partners 和 Radical Ventures 的共同参投，也进一步强化了这个信号——这两家 VC 在过去 12 个月都在从传统 SaaS 投资向 AI 基础设施倾斜。

关键风险与挑战

1. 「持续学习」的工程复杂度远超预期。 实时更新一个正在线上提供服务的 AI 模型，在工程上极其复杂：如何防止「灾难性遗忘」（catastrophic forgetting，新训练覆盖旧知识）？如何确保并发的 LoRA 更新不会相互干扰？如何在实时训练中保证模型的安全性和对齐性？这些都是尚未完全解决的研究问题，Trajectory 需要同时扮演「研究机构」和「产品公司」两种角色。

2. 数据飞轮的冷启动问题。 持续学习平台的价值，随着客户部署时间的增长而增长——一个用了 Trajectory 半年的 AI 产品，比刚开始用的产品拥有更多学习信号、更强的专业化能力。但对于刚刚接入的新客户，初期的价值体现可能不明显，这对销售和客户成功提出了很高的要求。

3. 大型基础模型提供商的「功能内化」风险。 如果 OpenAI、Anthropic 或 Google 决定将「持续学习」作为其 API 的标准功能推出，Trajectory 的独立平台价值将被直接压缩。目前 OpenAI 已有批次微调 API，Anthropic 也在测试类似功能——这个竞争风险是真实的。

4. 安全与合规的挑战。 让模型从用户行为中持续学习，意味着用户数据（包括用户的纠错、编辑）会成为训练数据。在 GDPR、HIPAA 等数据隐私法规日趋严格的环境中，Trajectory 需要为客户提供清晰的数据治理框架，否则企业客户（特别是金融、法律、医疗领域）将难以接受这种数据处理方式。

5. 1500 万美元的种子资金能支撑多久的研究+产品双轨道？ 持续学习研究是高度资本密集型的——大规模实验需要大量 GPU 算力，而产品开发需要工程人才。$15M 的种子轮对于一家「研究型+产品型」公司来说，runway 有限。下一轮融资的时间压力相当大。

Trajectory 的赌注，建立在一个关于 AI 产业演进的深刻判断上：AI 时代的竞争优势，不来自于你训练了什么，而来自于你持续学习了什么。过去十年，互联网公司的竞争壁垒是数据量和用户数量；未来十年，AI 原生公司的竞争壁垒，将是模型从用户行为中学习的速度和质量。Jeff Dean 和李飞飞押注这家成立不到一年的公司，是因为他们相信：让 AI 学会不停止学习，是整个行业下一个最重要的技术命题。 而 Trajectory，可能是这个命题最早的、也是目前最认真的解题者。