AI 的万亿美元级机遇：上下文图谱

本文作者：JayaGup10

上一代企业软件通过成为记录系统，创造了一个万亿美元规模的生态系统。Salesforce 用于客户。Workday 用于员工。SAP 用于运营。掌握权威数据，就掌握工作流，就掌握锁定效应。

当前的争论在于，这些系统在向代理转变的过程中能否存活。Jamin Ball 最近的文章《Long Live Systems of Record》直击要害。针对“代理会消灭一切”的叙事，他反驳称，代理并不会取代记录系统，而是抬高了“优秀记录系统”的标准。

我们同意。代理是跨系统、以行动为导向的。工作的 UX 正在与底层数据层分离。代理成为接口，但底层仍然需要一个权威来源。

我们进一步推进的地方在于：Ball 的框架假设智能体所需的数据已经存在于某个地方，智能体只需要更好的访问权限，以及更好的治理、语义合约，以及明确的规则来决定在不同用途下采用哪一种定义。

这只是一半的图景。另一半是实际上驱动企业运行的缺失层：决策轨迹 ——那些目前存在于 Slack 线程、优惠审批台对话、升级电话以及人们脑海中的例外、覆写、先例和跨系统上下文。

这才是关键的区分：

规则告诉智能体一般情况下应该发生什么 (“报告时使用官方 ARR”)

决策轨迹捕捉在这一具体案例中发生了什么 (“我们使用了 X 定义，在政策 v3.2 下，包含一项 VP 例外，基于先例 Z，以及我们做了哪些变更”)。

Agent 不仅仅需要规则。他们还需要访问决策轨迹，以展示规则过去是如何被应用的、例外是在什么情况下被批准的、冲突是如何被解决的、谁批准了什么，以及哪些先例才真正支配着现实。

这正是 agent 系统型创业公司具备结构性优势的地方。它们位于执行路径中。它们在做出决策时能看到完整上下文：跨系统收集了哪些输入、评估了哪些政策、调用了哪条例外流程、由谁批准，以及写入了什么状态。如果你将这些轨迹持久化下来，就能获得一种当今大多数企业并不存在的东西：一个可查询的“决策是如何做出的”记录。

我们将这些痕迹形成的累积结构称为上下文图谱：不是“模型的思维链”，而是一个跨实体与时间缝合起来的决策痕迹的动态记录，使先例变得可搜索。随着时间推移，这张上下文图谱将成为自治的真正事实来源——因为它解释的不只是发生了什么，还解释了为什么它被允许发生。

核心问题不在于现有的记录系统是否还能存续，而在于是否会涌现出全新的系统——用于记录决策，而不仅仅是对象——以及这些系统是否会成为下一个万亿美元级的平台。

记录系统未能捕捉到的内容

Agent 正在被部署到真实的工作流中——合同审查、quote-to-cash、支持问题解决——而团队正在撞上一堵仅靠治理无法解决的高墙。

问题不在于数据缺失，而在于缺少决策轨迹。Agent 会遇到与人类每天依靠判断力和组织记忆来解决的同样模糊性。但这些判断的输入并没有被存储为持久的工件。具体来说：

存在于人们头脑中的异常逻辑。 “我们总是会给医疗保健公司额外 10%，因为他们的采购周期非常残酷。” 这不在 CRM 里。这是通过入职培训和私下交流代代相传的部落知识。

来自过往决策的先例。 “我们上个季度为 X 公司构建过一个类似的优惠——我们应该保持一致。” 没有任何系统将这两笔交易关联起来，也没有记录当初为何选择这种结构。

跨系统综合。支持导语在 Salesforce 中查看顾客的 ARR，在 Zendesk 里看到两个未解决的升级问题，阅读一条标记了流失风险的 Slack 线程，然后决定升级处理。这种综合发生在他们的头脑中。工单里只写着“已升级到 Tier 3”。

发生在系统之外的审批链条。一位副总裁在一次 Zoom 通话中或通过 Slack 私信批准了一项折扣。商机记录只显示最终价格，却并未显示是谁批准了这一偏差，或其原因。

这就是“从未被捕获”的含义。并不是数据脏乱或被孤立，而是一开始就从未将连接数据与行动的推理过程当作数据来对待。

上下文图是持久存在的层

当初创公司为智能体编排层做埋点，在每次运行时输出一条决策轨迹，他们就获得了当今企业几乎从未拥有的东西：一段结构化、可回放的历史，展示上下文如何转化为行动。

这在实践中是什么样子? 一名续约代理提出了 20% 的折扣。政策将续约上限设为 10%，除非获得服务影响异常的批准。该代理从 PagerDuty 调取了三个 SEV-1 事件、Zendesk 中一个未解决的“若不修复即取消”升级工单，以及上一季度一位副总裁批准过类似异常的过往续约讨论记录。随后将该异常流转至财务部门。财务部门批准。CRM 最终只留下一个事实：“20% 折扣”。

一旦你拥有了决策记录，“为什么”就成为了一等数据。随着时间推移，这些记录会自然形成一个上下文图谱：企业已经关心的各类实体(账户、续约、工单、事件、政策、审批人、代理运行)，通过决策事件(真正关键的时刻)以及“为什么”的关联连接在一起。公司如今可以审计并调试自主性，将异常转化为先例，而不是每个季度都在 Slack 里重新学习同一个边缘案例。

反馈回路正是让这种复合效应成立的关键。被捕获的决策轨迹会成为可搜索的先例。而每一次自动化决策都会为图谱新增一条轨迹。

这一切并不要求从第一天开始实现完全自治。它始于人类在环(human-in-the-loop)：智能体提出方案、收集上下文、流转审批，并记录轨迹。随着相似案例的不断重复，路径中的更多环节可以实现自动化，因为系统拥有一个由过往决策和例外情况构成的结构化图书馆。即便最终仍由人类拍板，图谱也会持续增长，因为工作流层会将输入、审批以及背后的理由捕获为持久的先例，而不是任其消散在 Slack 中。

为什么既有厂商无法构建上下文图谱

Ball 对现有参与者演进到这种架构持乐观态度。仓库会演变为“真相注册表”，而 CRM 会演变为“带有 API 的状态机”。他的叙事强调的是演进，而非替代。

这或许适用于让现有数据更易访问，但并不适用于捕捉决策轨迹。

运营型既有厂商是孤立分散的，并且优先关注当前状态。

Salesforce 正在推进 Agentforce，ServiceNow 推出 Now Assist，Workday 正在为 HR 构建智能代理。他们的卖点是“我们已经有了数据，现在再加上智能。”

但这些代理继承了其母体架构的局限。Salesforce 构建在当前状态存储之上：它知道机会现在是什么样子，却不知道在做出决策时它是什么样子。当某个折扣被批准时，用来支撑该折扣的上下文并不会被保留下来。你无法重放决策时刻的世界状态，这意味着你无法对该决策进行审计、从中学习，或将其作为先例使用。

它们也继承了其父系统的盲点。一次支持升级并不只存在于 Zendesk 中。它依赖于来自 CRM 的顾客分层、来自计费系统的 SLA 条款、来自 PagerDuty 的近期故障，以及在 Slack 线程中标记的流失风险。没有任何现有厂商能看到这一切，因为没有任何现有厂商处在跨系统的路径中。

数据仓库厂商面临的是另一个问题：它们位于读路径上，而不是写路径上。

定位

@Snowflake

和 Databricks 作为“事实注册表”层。两者都在加码投入——Snowflake 推进 Cortex 并收购了 Streamlit，Databricks 收购了 Neon 并推出了 Lakebase 和 AgentBricks。其卖点是：数据平台取代记录系统，成为 AI agents 的基础。

数据仓库确实具备基于时间的视角。你可以查询历史快照，追踪指标如何变化，并跨周期对比状态。但数据仓库是通过 ETL 在决策已经发生之后才接收数据的。等数据落入 Snowflake 时，决策上下文已经消失了。

一个只能在事后看到读取结果的系统，无法成为决策谱系的记录系统。它可以告诉你发生了什么，但无法告诉你为什么会发生。

Databricks 在拼齐这些组件方面走得更远。但接近代理构建的地方，并不等同于处在决策发生的执行路径中。

代理系统初创公司具备结构性优势：它们处在编排路径上。

当一个代理对升级事件进行分流、响应事故，或决定是否给予折扣时，它会从多个系统中拉取上下文、评估规则、解决冲突并采取行动。编排层能够看到全貌：收集了哪些输入、应用了哪些策略、授予了哪些例外以及原因。因为它在执行工作流，能够在决策发生的当下捕获这些上下文——不是通过 ETL 在事后获取，而是实时地、作为一等记录来保存。

这就是上下文图谱，它将成为 AI 时代企业最有价值的单一资产。

既有巨头会展开反击。他们会尝试通过收购来拼接编排能力。他们会锁定 API，并采用出站费用来提高数据提取的成本——这正是超大规模云服务商曾经使用的那套打法。他们会构建自己的代理框架，并推动“把一切都留在我们生态中”的叙事。

但要捕获决策轨迹，必须在提交时就处于执行路径之中，而不是事后再去附加治理层。既有巨头可以让提取变得更困难，但他们无法把自己插入到一个他们从未参与过的编排层里。

初创公司的三条路径

代理系统初创公司将走上不同的路径，每一条路径都有其各自的权衡取舍。

有些会从第一天起就替换现有的记录系统。围绕代理式执行重建的 CRM 或 ERP，将事件溯源状态和策略捕获作为架构的原生能力。这很难，因为现有巨头根深蒂固，但在转型时刻这种路径会变得可行。

在众多进军 AI SDR 类别的初创公司中，

Regie

选择构建一个 AI 原生的销售互动平台，用以取代像 Outreach/Salesloft 这样的传统平台——这些平台是为人类在碎片化工具链上执行流程而设计的。Regie 面向的是一个混合团队，其中代理是一级参与者：它可以进行潜在客户开发、生成外联内容、执行跟进、处理路由，并在需要时升级给人类。

有些会替换的是模块而非整个系统。这些初创公司瞄准异常和审批高度集中的特定子工作流，随后为这些决策成为记录系统，并将最终状态同步回现有系统。

Maximor

正在金融领域这样做：在不拆除总账(GL)的前提下，实现现金管理、结账管理和核心会计工作流的自动化。ERP 仍然是账簿，而 Maximor 则成为承载对账逻辑的唯一真实来源。

有些则会创造全新的记录系统。这些初创公司起初是编排层，但它们会持久化企业过去从未系统性存储过的东西：决策过程的轨迹。随着时间推移，这一可回放的谱系将成为权威性工件。代理层不再只是“自动化”，而是演变为企业回答“我们为什么这么做?”的地方。

PlayerZero

体现了这一模式。生产工程处在 SRE、支持、QA 和开发的交汇点：这是一种典型的“胶水职能”，在人类承载而软件无法捕捉的上下文之间发挥作用。PlayerZero 从自动化 L2/L3 支持入手，但真正的资产是它构建的上下文图：一个关于代码、配置、基础设施以及客户行为在现实中如何相互作用的动态模型。该图谱成为“为什么会出问题?”以及“这个更改会不会破坏生产环境?”的事实来源——这些都是现有系统无法回答的问题。

随着初创公司沿着这些路径前进，面向代理的可观测性将成为关键基础设施。随着决策轨迹不断累积、上下文图持续增长，企业将需要在规模化条件下监控、调试并评估代理的行为。

Arize

正在为这一新技术栈构建可观测性层——让团队能够看清代理如何进行推理、在哪些地方失败，以及其决策随时间推移的表现。正如 Datadog 成为监控应用的关键基础设施一样，Arize 有望成为监控和提升代理决策质量的关键基础设施。

创始人的关键信号

用于判断应该在哪里构建的信号存在重叠，但并不完全相同。

有两个信号适用于这三种机会：

人员规模庞大。如果一家公司有 50 个人在手动完成某个工作流程(分派工单、请求分流，或在系统之间对账数据)，那就是一个信号。之所以需要这些人力，是因为决策逻辑过于复杂，无法用传统工具实现自动化。

异常密集的决策。常规、确定性的工作流程不需要决策溯源：智能体只需执行即可。真正有价值的切入点在于逻辑复杂、需要参考先例、并且“视情况而定”才是诚实答案的地方。可以想想交易台、承保、合规审查以及升级处理管理等用例。

有一个信号明确指向全新的记录系统机会：

存在于系统交汇处的组织。RevOps 之所以存在，是因为需要有人对销售、财务、市场和客户成功之间进行协调与对账。DevOps 之所以存在，是因为需要有人在开发、IT 和支持之间搭建桥梁。Security Ops 位于 IT、工程和合规之间。

这些“胶水”职能本身就是一个信号。它们的出现，恰恰是因为没有任何一个单一的记录系统拥有跨职能工作流。组织架构设立了这样的角色，用来承载软件无法捕捉的上下文。

一个自动化该角色的智能体，并不仅仅是更快地执行步骤。它能够持久化该角色被创造出来所要产出的决策、例外情况和先例。这正是通往新一代记录系统的路径：不是通过替换现有系统，而是捕捉只有当智能体嵌入工作流之后才会显现的一类真相。

重新构想的记录系统

问题不在于记录系统是否会存续——它们一定会。真正的问题在于，下一个万亿美元级的平台，是通过在现有数据之上叠加 AI 构建，还是通过捕捉让数据变得可执行的决策轨迹来构建。

我们认为是后者。而如今正在构建上下文图谱的初创公司正在奠定这一基础。

发表于 2025.12.22 作者：Jaya Gupta 和 Ashu Garg

#企业级应用 #深度学习

AI 的万亿美元级机遇：上下文图谱

了解 RecodeX 的更多信息