AI 的万亿美元级机遇:上下文图谱
本文作者:JayaGup10
上一代企业软件通过成为记录系统,创造了一个万亿美元规模的生态系统。Salesforce 用于客户。Workday 用于员工。SAP 用于运营。掌握权威数据,就掌握工作流,就掌握锁定效应。
当前的争论在于,这些系统在向代理转变的过程中能否存活。Jamin Ball 最近的文章《Long Live Systems of Record》直击要害。针对“代理会消灭一切”的叙事,他反驳称,代理并不会取代记录系统,而是抬高了“优秀记录系统”的标准。
我们同意。代理是跨系统、以行动为导向的。工作的 UX 正在与底层数据层分离。代理成为接口,但底层仍然需要一个权威来源。
我们进一步推进的地方在于:Ball 的框架假设智能体所需的数据已经存在于某个地方,智能体只需要更好的访问权限,以及更好的治理、语义合约,以及明确的规则来决定在不同用途下采用哪一种定义。
这只是一半的图景。 另一半是实际上驱动企业运行的缺失层: 决策轨迹 ——那些目前存在于 Slack 线程、优惠审批台对话、升级电话以及人们脑海中的例外、覆写、先例和跨系统上下文。
这才是关键的区分:
规则告诉智能体一般情况下应该发生什么 (“报告时使用官方 ARR”)
决策轨迹 捕捉 在这一具体案例中发生了什么 (“我们使用了 X 定义,在政策 v3.2 下,包含一项 VP 例外,基于先例 Z,以及我们做了哪些变更”)。
Agent 不仅仅需要规则。他们还需要访问决策轨迹,以展示规则过去是如何被应用的、例外是在什么情况下被批准的、冲突是如何被解决的、谁批准了什么,以及哪些先例才真正支配着现实。
这正是 agent 系统型创业公司具备结构性优势的地方。它们位于 执行路径中 。它们在做出决策时能看到完整上下文:跨系统收集了哪些输入、评估了哪些政策、调用了哪条例外流程、由谁批准,以及写入了什么状态。如果你将这些轨迹持久化下来,就能获得一种当今大多数企业并不存在的东西:一个可查询的“决策是如何做出的”记录。
我们将这些痕迹形成的累积结构称为上下文图谱 :不是“模型的思维链”,而是一个跨实体与时间缝合起来的决策痕迹的动态记录,使先例变得可搜索。随着时间推移,这张上下文图谱将成为自治的真正事实来源——因为它解释的不只是发生了什么 ,还解释了为什么它被允许发生 。
核心问题不在于现有的记录系统是否还能存续,而在于是否会涌现出全新的系统——用于记录决策,而不仅仅是对象——以及这些系统是否会成为下一个万亿美元级的平台。
记录系统未能捕捉到的内容
Agent 正在被部署到真实的工作流中——合同审查、quote-to-cash、支持问题解决——而团队正在撞上一堵仅靠治理无法解决的高墙。
问题不在于数据缺失,而在于缺少决策轨迹。Agent 会遇到与人类每天依靠判断力和组织记忆来解决的同样模糊性。但这些判断的输入并没有被存储为持久的工件。具体来说:
存在于人们头脑中的异常逻辑。 “我们总是会给医疗保健公司额外 10%,因为他们的采购周期非常残酷。” 这不在 CRM 里。这是通过入职培训和私下交流代代相传的部落知识。
来自过往决策的先例。 “我们上个季度为 X 公司构建过一个类似的优惠——我们应该保持一致。” 没有任何系统将这两笔交易关联起来,也没有记录当初为何选择这种结构。
跨系统综合。 支持导语在 Salesforce 中查看顾客的 ARR,在 Zendesk 里看到两个未解决的升级问题,阅读一条标记了流失风险的 Slack 线程,然后决定升级处理。这种综合发生在他们的头脑中。工单里只写着“已升级到 Tier 3”。
发生在系统之外的审批链条。 一位副总裁在一次 Zoom 通话中或通过 Slack 私信批准了一项折扣。商机记录只显示最终价格,却并未显示是谁批准了这一偏差,或其原因。
这就是“从未被捕获”的含义。并不是数据脏乱或被孤立,而是一开始就从未将连接数据与行动的推理过程当作数据来对待。
上下文图是持久存在的层
当初创公司为智能体编排层做埋点,在每次运行时输出一条决策轨迹,他们就获得了当今企业几乎从未拥有的东西:一段结构化、可回放的历史,展示上下文如何转化为行动。
这在实践中是什么样子? 一名续约代理提出了 20% 的折扣。政策将续约上限设为 10%,除非获得服务影响异常的批准。该代理从 PagerDuty 调取了三个 SEV-1 事件、Zendesk 中一个未解决的“若不修复即取消”升级工单,以及上一季度一位副总裁批准过类似异常的过往续约讨论记录。随后将该异常流转至财务部门。财务部门批准。CRM 最终只留下一个事实:“20% 折扣”。
一旦你拥有了决策记录,“为什么”就成为了一等数据。随着时间推移,这些记录会自然形成一个上下文图谱 :企业已经关心的各类实体(账户、续约、工单、事件、政策、审批人、代理运行),通过决策事件(真正关键的时刻)以及“为什么”的关联连接在一起。公司如今可以审计并调试自主性,将异常转化为先例,而不是每个季度都在 Slack 里重新学习同一个边缘案例。
反馈回路正是让这种复合效应成立的关键。 被捕获的决策轨迹会成为可搜索的先例。而每一次自动化决策都会为图谱新增一条轨迹。
这一切并不要求从第一天开始实现完全自治。它始于人类在环(human-in-the-loop):智能体提出方案、收集上下文、流转审批,并记录轨迹。随着相似案例的不断重复,路径中的更多环节可以实现自动化,因为系统拥有一个由过往决策和例外情况构成的结构化图书馆。即便最终仍由人类拍板,图谱也会持续增长,因为工作流层会将输入、审批以及背后的理由捕获为持久的先例,而不是任其消散在 Slack 中。
为什么既有厂商无法构建上下文图谱
Ball 对现有参与者演进到这种架构持乐观态度。仓库会演变为“真相注册表”,而 CRM 会演变为“带有 API 的状态机”。他的叙事强调的是演进,而非替代。
这或许适用于让现有数据更易访问,但并不适用于捕捉决策轨迹。
运营型既有厂商是孤立分散的,并且优先关注当前状态。
Salesforce 正在推进 Agentforce,ServiceNow 推出 Now Assist,Workday 正在为 HR 构建智能代理。他们的卖点是“我们已经有了数据,现在再加上智能。”
但这些代理继承了其母体架构的局限。Salesforce 构建在当前状态存储之上:它知道机会现在是什么样子,却不知道在做出决策时它是什么样子。当某个折扣被批准时,用来支撑该折扣的上下文并不会被保留下来。你无法重放决策时刻的世界状态,这意味着你无法对该决策进行审计、从中学习,或将其作为先例使用。
它们也继承了其父系统的盲点。一次支持升级并不只存在于 Zendesk 中。它依赖于来自 CRM 的顾客分层、来自计费系统的 SLA 条款、来自 PagerDuty 的近期故障,以及在 Slack 线程中标记的流失风险。没有任何现有厂商能看到这一切,因为没有任何现有厂商处在跨系统的路径中。
数据仓库厂商面临的是另一个问题:它们位于读路径上,而不是写路径上。
定位
和 Databricks 作为“事实注册表”层。两者都在加码投入——Snowflake 推进 Cortex 并收购了 Streamlit,Databricks 收购了 Neon 并推出了 Lakebase 和 AgentBricks。其卖点是:数据平台取代记录系统,成为 AI agents 的基础。
数据仓库确实具备基于时间的视角。你可以查询历史快照,追踪指标如何变化,并跨周期对比状态。但数据仓库是通过 ETL 在决策已经发生之后才接收数据的。等数据落入 Snowflake 时,决策上下文已经消失了。
一个只能在事后看到读取结果的系统,无法成为决策谱系的记录系统。它可以告诉你发生了什么,但无法告诉你为什么会发生。
Databricks 在拼齐这些组件方面走得更远。但接近代理构建的地方,并不等同于处在决策发生的执行路径中。
代理系统初创公司具备结构性优势:它们处在编排路径上。
当一个代理对升级事件进行分流、响应事故,或决定是否给予折扣时,它会从多个系统中拉取上下文、评估规则、解决冲突并采取行动。编排层能够看到全貌:收集了哪些输入、应用了哪些策略、授予了哪些例外以及原因。因为它在执行工作流,能够在决策发生的当下捕获这些上下文——不是通过 ETL 在事后获取,而是实时地、作为一等记录来保存。
这就是上下文图谱,它将成为 AI 时代企业最有价值的单一资产。
既有巨头会展开反击。 他们会尝试通过收购来拼接编排能力。他们会锁定 API,并采用出站费用来提高数据提取的成本——这正是超大规模云服务商曾经使用的那套打法。他们会构建自己的代理框架,并推动“把一切都留在我们生态中”的叙事。
但要捕获决策轨迹,必须在提交时就处于执行路径之中,而不是事后再去附加治理层。既有巨头可以让提取变得更困难,但他们无法把自己插入到一个他们从未参与过的编排层里。
初创公司的三条路径
代理系统初创公司将走上不同的路径,每一条路径都有其各自的权衡取舍。
有些会从第一天起就替换现有的记录系统。 围绕代理式执行重建的 CRM 或 ERP,将事件溯源状态和策略捕获作为架构的原生能力。这很难,因为现有巨头根深蒂固,但在转型时刻这种路径会变得可行。
在众多进军 AI SDR 类别的初创公司中,
选择构建一个 AI 原生的销售互动平台,用以取代像 Outreach/Salesloft 这样的传统平台——这些平台是为人类在碎片化工具链上执行流程而设计的。Regie 面向的是一个混合团队,其中代理是一级参与者:它可以进行潜在客户开发、生成外联内容、执行跟进、处理路由,并在需要时升级给人类。
有些会替换的是模块而非整个系统。 这些初创公司瞄准异常和审批高度集中的特定子工作流,随后为这些决策成为记录系统,并将最终状态同步回现有系统。
正在金融领域这样做:在不拆除总账(GL)的前提下,实现现金管理、结账管理和核心会计工作流的自动化。ERP 仍然是账簿,而 Maximor 则成为承载对账逻辑的唯一真实来源。
有些则会创造全新的记录系统。 这些初创公司起初是编排层,但它们会持久化企业过去从未系统性存储过的东西:决策过程的轨迹。随着时间推移,这一可回放的谱系将成为权威性工件。代理层不再只是“自动化”,而是演变为企业回答“我们为什么这么做?”的地方。
体现了这一模式。生产工程处在 SRE、支持、QA 和开发的交汇点:这是一种典型的“胶水职能”,在人类承载而软件无法捕捉的上下文之间发挥作用。PlayerZero 从自动化 L2/L3 支持入手,但真正的资产是它构建的上下文图:一个关于代码、配置、基础设施以及客户行为在现实中如何相互作用的动态模型。该图谱成为“为什么会出问题?”以及“这个更改会不会破坏生产环境?”的事实来源——这些都是现有系统无法回答的问题。
随着初创公司沿着这些路径前进,面向代理的可观测性将成为关键基础设施。 随着决策轨迹不断累积、上下文图持续增长,企业将需要在规模化条件下监控、调试并评估代理的行为。
正在为这一新技术栈构建可观测性层——让团队能够看清代理如何进行推理、在哪些地方失败,以及其决策随时间推移的表现。正如 Datadog 成为监控应用的关键基础设施一样,Arize 有望成为监控和提升代理决策质量的关键基础设施。
创始人的关键信号
用于判断应该在哪里构建的信号存在重叠,但并不完全相同。
有两个信号适用于这三种机会:
人员规模庞大。 如果一家公司有 50 个人在手动完成某个工作流程(分派工单、请求分流,或在系统之间对账数据),那就是一个信号。之所以需要这些人力,是因为决策逻辑过于复杂,无法用传统工具实现自动化。
异常密集的决策。 常规、确定性的工作流程不需要决策溯源:智能体只需执行即可。真正有价值的切入点在于逻辑复杂、需要参考先例、并且“视情况而定”才是诚实答案的地方。可以想想交易台、承保、合规审查以及升级处理管理等用例。
有一个信号明确指向全新的记录系统机会:
存在于系统交汇处的组织。RevOps 之所以存在,是因为需要有人对销售、财务、市场和客户成功之间进行协调与对账。DevOps 之所以存在,是因为需要有人在开发、IT 和支持之间搭建桥梁。Security Ops 位于 IT、工程和合规之间。
这些“胶水”职能本身就是一个信号。它们的出现,恰恰是因为没有任何一个单一的记录系统拥有跨职能工作流。组织架构设立了这样的角色,用来承载软件无法捕捉的上下文。
一个自动化该角色的智能体,并不仅仅是更快地执行步骤。它能够持久化该角色被创造出来所要产出的决策、例外情况和先例。这正是通往新一代记录系统的路径:不是通过替换现有系统,而是捕捉只有当智能体嵌入工作流之后才会显现的一类真相。
重新构想的记录系统
问题不在于记录系统是否会存续——它们一定会。真正的问题在于,下一个万亿美元级的平台,是通过在现有数据之上叠加 AI 构建,还是通过捕捉让数据变得可执行的决策轨迹来构建。
我们认为是后者。而如今正在构建上下文图谱的初创公司正在奠定这一基础。
发表于 2025.12.22 作者:Jaya Gupta 和 Ashu Garg