代理型经济中的支付:让代理进行支付
本文信息来源:decentralised

在 《为互联网定价》 中,我们曾指出,当计量变得无摩擦时,机器将会进行支付。人类并未完全接受微支付,是因为关注计量所需的麻烦和心智负担。但机器不同。它们看到的只有 1 和 0。心智容量或上下文切换不会影响它们执行任务的能力。如果将粒度细化到低于一美分能让流程更高效,它们就会这样做,这与人类不同。
我们在上一篇文章结尾提出了一个问题:当 agent 出错时会发生什么?无论 agent 的初衷是否正确,最终我们并不会在每一步都对 agent 进行监督。
我们正处于一个空白地带:新技术缺失了旧有基础设施中最重要的一点——在出现问题时能够撤销支付的能力。本文正是围绕这一问题展开。我们将探讨智能体实现自主所需的条件、谁在构建相关基础设施,以及为何新的初创公司将会在区块链 rails 与自主智能体的交汇点上涌现。
新兴标准
任何形式的商业活动都涉及三方——买方、卖方,以及促成双方互动的中介。中介可以是像 Amazon 这样的平台或市场,也可以是像 Visa 这样的卡组织,负责促成支付。

买方侧
面向消费者的应用通常会处理资金或交易,并在过程中抽取一部分收益。但当消费者变成代表我们行事的 AI 时,会发生什么?目前有一些新兴标准正在寻找这个问题的答案。
ChatGPT 拥有 7 亿活跃用户,试图从 AI 中获取各种帮助。虽然我们还不能通过代理界面进行买卖,但已经将其用于信息发现。无论是购买跑鞋还是在 El Calafate 寻找酒店,我一直在用 AI 做对比。如果能在同一个界面完成购买,将会方便得多。这正是 OpenAI 正在做的事情——与 Stripe 合作推出 Agentic Commerce Protocol(ACP)。

这是目前代理处理资金的最直接方式。用户在每一步中都保持控制。当有人下订单时,ChatGPT 会使用 ACP 将必要的细节发送到商家的后端。商家随后接受或拒绝订单,通过其现有的支付服务提供商处理支付,并像现在一样负责履约和顾客支持。
将通过 ACP 进行的商业行为视为:允许你的实习生花费固定金额,而由你来授权产品或服务的选择、商家以及最终支付。
虽然 OpenAI 和 Stripe 推出了 ACP,Google 则提供了 Agents to Payments(AP2)。在深入讨论之前,我们先从更宏观的角度来看。Google 想要解决的是互操作性问题。目前,AI agent 仍然各自为政、存在于孤岛之中。Gemini 无法与 Claud 对话,ChatGPT 也不了解 Perplexity 中发生了什么。你懂的。
理想情况下,当任务变得复杂时,我们希望这些智能体能够使用一种通用语言进行沟通,并协同工作。Google 开发了 A2A(Agent2Agent),这是一种协议,使不同的智能体能够进行通信和协调。
但仅仅能够彼此交谈还不够。智能体还需要能够使用工具、访问 API 以及各种服务。Model Context Protocol(MCP)使智能体能够使用 Google Calendar、Notion 和 Figma 等工具。

MCP 定义了一种通用语言。只要所有代理都使用 MCP 进行交流,代理就可以在无需任何定制代码的情况下使用任何工具。它由 Anthropic 构建,但规范是开放的,各家公司正在迅速采用。MCP 服务器本质上是位于公司现有 API 前的一层翻译层,它以标准化的格式对外暴露公司的服务,使任何与 MCP 兼容的代理都能够理解和使用。
好吧,让我们回到 AP2。一个更简单的理解方式是:MCP 赋予了代理访问数据、文件和工具的能力;A2A 赋予了它们发声的能力,它们可以与其他代理进行通信;而 AP2 则给予它们一个钱包,使它们现在可以安全地花费资金。
所有这些协议都让用户保持主导地位,Agent 仅拥有有限的支出权限。这解决了分发和资金流的问题。但它们都尚未弄清楚,当 Agent 出错时该如何处理。
卖方侧
买方侧只是故事的一半。卖方侧正在涌现出不同的标准,这些标准关注的是机器如何为访问 API、数据和内容进行支付。
目前讨论最多的是 x402 标准 ,这是由 Coinbase 开发的一个开放协议。它重新启用了 HTTP 状态码 402,该状态码早在 1997 年就被定义为“需要支付”。但它实际上从未被使用过。x402 通过将其与能够经济高效地结算微支付的稳定币支付相结合,让这一状态码焕发了新的生命。
x402 将一次 HTTP 请求转变为一次付费请求。每当需要支付时,服务器就会发出要求。由于代理拥有预先分配的预算,它会在同一流程中向服务器完成支付并接收数据。这使得按请求付费或按调用付费在机器商务中变得切实可行。
借助 x402,代理可以只为当下真正需要的内容支付费用。例如,一篇在付费墙后的文章只需两美分;一次 API 调用只需几分之一美分。交易在链上数秒内完成结算,无需建立持续的关系。

Cloudflare 将这一概念进一步具体化,构建了他们的 Pay-per-Crawl 系统。它在底层使用 HTTP 402,但之所以重要,是因为 Cloudflare 在市场中的主导地位。20% 的全部 Web 流量 都经过 Cloudflare,这让他们拥有巨大的杠杆。
Pay-per-Crawl 利用 Cloudflare 的边缘网络,在向 AI 爬虫提供内容之前要求付费。这将访问转变为强制执行的计量。随着人们不再从搜索引擎点击进入,而是直接阅读 AI 生成的摘要,出版商一直在眼看着自己的流量断崖式下滑。通过 Pay-per-Crawl,他们可以在每次爬虫访问时直接向 AI 实验室收费。
卡网络也在尝试扩展其现有的支付通道,以处理代理交易。Visa 宣布推出 MCP Server 以及 Acceptance Agent Toolkit。Mastercard 有一个名为 Agent Pay 的项目。两者都处于非常早期的阶段,仍在试点中,但它们之所以重要,是因为 Visa 和 Mastercard 已经拥有全球分发能力、发卡行关系以及无处不在的商户受理网络。其基本理念是注册代理、添加支出控制,并在当今处理人类消费的同一卡支付通道上,实现由代理发起的交易。
迫切需要弥合信托鸿沟
所有这些标准都假设支付将顺利完成且结果符合预期。ACP 和 AP2 在结账过程中让人类保持在回路中,提供了一定的安全性。x402 的各类变体用于机器对机器的数据访问,通常风险较低。卡网络延伸了其熟悉的保护机制,但代价是更慢的结算时间和更高的费用。
在大规模实现微支付时,速度是首要目标。银行卡轨道需要数天才能完成结算,并且每笔交易都会让商家承担几个百分点的成本。加密轨道可在数秒内完成结算,成本仅为几美分的一小部分。但这种效率是以不可逆性为代价的。一旦加密支付完成,就无法撤回。
商业围绕着“可能出错”这一前提构建了完整的基础设施。当你用信用卡购物出现问题时,是有一套流程的。你联系你的银行,银行对这笔费用提出争议,卡组织进行调查,在此期间暂时冻结资金,最终要么退款给你,要么支持商家。2025 年有 2.61 亿笔交易被提出争议,总金额达 340 亿美元。
在稳定币轨道上运行的代理却完全不具备这些机制。
当代理开始与其他代理进行协作时,情况会变得更加复杂。当涉及数百甚至数千个多代理工作流时,理清责任归属可能会变成一场噩梦。
卡组织不会承担这种风险,至少在其当前的经济模式下不会。Visa 和 Mastercard 的代理项目仍然承载着标准的交换费以及多天的结算周期。它们可以转向即时报价的稳定币结算,但这样做将意味着放弃支撑其收费合理性的争议处理基础设施。
传统的金融体系并未内置纠纷解决机制。Diner’s Club 作为第一张信用卡,大约发行于 1950 年。但又过了 24 years,消费者才可以对交易提出争议。我们今天习以为常的现代基础设施,是随着问题的暴露以及机构的应对而逐步形成的。
代理型商业并没有这种时间上的从容。API 请求已经占到 Cloudflare 所处理的动态 HTTP 流量的 60%。机器人和自动化几乎构成了 一半 的全部网络流量。ChatGPT 的 7 亿用户如今可以通过 ACP 直接在 Etsy 完成结账,Shopify 的集成也即将到来。规模已然存在,人们使用代理来完成任务的行为潜力也已显现。距离代理被用于商业交易,已经不会太久了。
因此,我们可以让传统金融基础设施继续维持更长的结算周期,或者有意识地构建与快速区块链结算相互补充的信托基础设施。前者将阻碍智能体充分发挥其潜力;后者则是一个机遇,也是智能体商业发展演进过程中合乎逻辑的扩展。
那么这在实际中到底是什么样的?
毫不意外,这涉及两个部分:交易之前和交易之后。

交易之前
一个代理是否甚至应该被允许进行交易,取决于三个因素:识别交易对手、采用欺诈检测,以及使用声誉评分来就定价和访问权限做出明智的选择。
Plaid 连接 美国每两个银行账户中就有一个 ,每天处理一百万个账户连接。当你需要向 Venmo 证明自己身份时,它会使用 Plaid 来验证你的身份。
目前,任何与 API 交互、尝试抓取网络或进行支付的代理都没有对等的机制。服务器看到的只是一些模糊的 ID,比如钱包地址或 API key。它完全不知道是谁在发起调用。不存在一种能够在不同服务之间累积良好声誉的一致身份,因此每一次新的交互都只能从零信任重新开始。
2024 年,美国成年人因身份欺诈损失约 470 亿美元 。
“Know Your Agent(KYA)”层的运作方式将类似于 Plaid 成为金融科技领域身份基础设施的过程。它将发放可持久、可撤销的凭证,将代理与某个人类或组织关联起来。
银行卡网络花了数十年时间构建能够在数以百万计的交易中识别可疑模式的系统。他们了解正常的人类消费行为,并能实时标记异常情况。如果某个智能体被攻破并开始在多个商户处进行未经授权的购买,目前并不存在一个共享的欺诈图谱来将其捕获。
Visa 表示,在 2019–24 年期间向其系统安全投入 400 亿美元 后,成功阻止了企图实施的欺诈行为,并为此追加投资 110 亿美元 。Stripe 每年处理超过 1.4 万亿美元的支付 ,并基于这一全部规模来训练其 Radar 欺诈检测系统。在 2024 年的黑色星期五和网络星期一期间,Radar 阻止了 2090 万笔、价值 9.17 亿美元的欺诈交易 。
针对代理并不存在这样的欺诈检测层。当某个代理进行一笔 x402 支付时,没有共享的欺诈图谱来标记可疑行为,例如高于正常水平的支出金额或更高的支出频率。
如果没有持久的身份和声誉,每一次 agent 之间的交互都要从零开始。声誉深深植根于人类商业活动中。你看到的广告取决于你刷过的短视频。当司机决定是否接受你的请求时,你的 Uber 星级评分是一个重要因素。你通过借钱并按时偿还贷款所形成的信用评分,会伴随你走向每一家金融机构。对于 agent 来说,也不应有所不同。
交易之后
拒付是银行卡支付网络在发生争议时的处理方式:当顾客就一笔信用卡/借记卡交易向其银行提出争议后,资金会被从商户处退回。拒付同样会被滥用。2023 年,拒付给商户造成的损失估计达 1174.7 亿美元 。平均来看,每因拒付损失 1 美元,企业在计入手续费、商品损失以及行政管理开销后,通常还会额外承担至少 3.75–4.61 美元的总成本。

商家在他们提出抗辩的纠纷中仅赢得 8.1%。84% 的消费者认为,与直接向商家请求退款相比,发起拒付要更简单。
由智能体发起的稳定币交易将在数秒内完成结算,目前尚不存在任何追索机制。Cloudflare 提出了 x402 的延迟结算扩展 ,允许在资金不可逆转地转移之前设置保留期。
开发者已经在构建这些基础设施原语。在 ETHGlobal Buenos Aires 上,一个团队构建了 Private-Escrow x402。该托管方案要求买家预先将资金存入智能合约,并在支付时于链下签署意图。一名协调者将数百个已签署的意图批量合并为一笔结算交易,使燃料费降低了 28 倍。
但那只是一个基础设施原语。还需要有人将其产品化。
这一切由谁来构建?
我不禁想到电信行业曾被运营商主导的那个时代。他们与每一位手机用户都有计费关系,却错失了从智能手机中创造价值的机会。分发和移动广告的价值被截走,而这些领域合计创造了数千亿美元的收入,本可以被电信运营商所获取。
卡网络目前正面临这一问题的一个变体。Visa 和 Mastercard 花费了数十年时间构建代理型商业所缺乏的那套信任基础设施。但他们的整个模式依赖于交换费,而交换费之所以存在,只是因为他们控制着支付轨道。他们每年投入数十亿美元来维护和改进这套基础设施,其资金只能来自几个百分点的交易手续费。为稳定币交易构建消费者保护机制,意味着在没有任何附带收入的情况下补贴一条竞争性的支付轨道。
如果信用卡网络不会去做这件事,那么下一批既有参与者将是像 OpenAI、Google 和 Anthropic 这样的 AI 实验室。所有这些实验室都希望他们的代理能够在任何地方、被每一家商户、并跨越每一个协议使用。运行一个中心化的身份注册机制意味着当这些代理出现不当行为时他们将承担责任,而他们并不想成为你预订出错时的仲裁法院。
他们更希望由其他人来构建身份与追责机制,作为可供接入的基础设施,就像他们今天接入支付或搜索一样。
Cloudflare 处在一个颇为特殊的位置。他们已经掌握了极大比例的 Web 流量,也已经在运行机器人检测。他们的 AI 审计工具可以让内容发布者追踪哪些爬虫在访问其内容以及访问频率。从“识别机器人”延伸到“验证代理的凭证和信誉”,在技术上并不是一次巨大的跨越。
但 Cloudflare 一直将自己定位为中立的基础设施。一旦他们开始发放信任评分或裁决争议,就会变得更像一个监管者。那是一个具有不同责任和风险的业务。
利用三大切入点的初创公司
你无法在模型质量上击败 OpenAI,也无法通过更多流量击败 Cloudflare。你必须在技术栈中找到一些它们的商业模式(至少目前)无法涉足、但仍然具备价值的领域。我认为这些切入点就是——身份、追索机制,以及归因。
代理身份是最直接的切入点。注册表模型已经被验证过。尽管 Plaid 是一个老生常谈的例子,但非常贴切。他们为银行账户做到了这一点;创业公司也可以为代理做到同样的事。签发凭证,让代理逐步积累声誉,并在商家接受支付之前提供一个可供查询的评分。其护城河来自网络效应。一旦有足够多的商家在你的注册表中核验凭证,代理就别无选择,只能维持良好的信誉。
追索更难,因为它需要承担风险。可以把它想象成保险:在每笔交易中收取一小笔费用,当问题发生时吸收损失。规模才是关键。银行卡清算费用通常在 1.5% 到 3% 之间,用于覆盖争议解决成本。稳定币支付轨道的成本只是其中的一小部分,因此追索层可以在收取 50 个基点的情况下提供相当的保护,同时仍然保持利润空间。
归因是其中最具推测性的部分,但最终一定会被构建出来。当智能体开始影响购买决策时,品牌将付费以影响被推荐的内容。拍卖机制是可以被设计的。但这一点存在冷启动问题,而另外两项则没有。必须同时有品牌、智能体和商家参与,市场才能正常运作。
这些楔子的重要性取决于代理经济所处的阶段。当代理在每笔交易都无需人工批准的情况下行动时,身份至关重要。只要代理开始转移真实资金,追责机制就变得重要。只有当代理对代理的商业活动达到足以支撑广告市场的规模时,归因才会真正发挥作用。这也引出了这一演进路径实际上会呈现出怎样的形态。

初创公司将构建 agentic economy 基础设施的组成部分
代理的演进路径可以划分为三个阶段。
- 它们最初作为接口存在。
- 随后在人工监督下执行操作。
- 它们彼此之间自主进行交易。

我们正处于第一阶段。ChatGPT 与 Etsy 的结账集成就是一个很好的例子。我们通过聊天界面对话式地浏览商品(尽管目前还不是所有人都这么做),由 agent 提供选项,但最终的扳机仍然由我们人类扣下。信任完全借助于现有的基础设施。
这一阶段属于既有巨头,因为这是一个分发博弈。价值将归于掌控购买决策发生所在接口的一方。
第二阶段的标志是代理获得了更高的自主性。代理不再只是建议行程,而是直接预订航班、租车和酒店。我们提供意图或约束条件,由代理执行,我们再对最终结果进行验证。
正是在这一阶段,信任层变得至关重要。没有追索机制,用户不会将权限委托给代理;同样,如果没有某种方式来验证代理的身份和授权,商家也不会接受由代理发起的支付。
这同样是真正属于初创公司的机会所在。现有巨头或许缺乏明确的激励,将资源投入到为稳定币轨道构建信任基础设施上,因为在它们所主导的现有阶段中,仍有巨大的增长空间在等待着它们。
OpenAI 今年创造了 130 亿美元 的收入。作为对比,Tether 有望在利润上超过这一数字,截至 2025 年 10 月,其 100 亿美元的利润 。身份、追责和归因层将由新公司涌现,这些公司专注于解决代理能力与用户许可边界上的特定问题。
第三阶段是自主代理商业。你的代理不会为日常决策请求权限。它会与其他代理进行谈判,为算力和带宽出价,参与广告拍卖,并持续结算成千上万笔小额交易。稳定币非常适合作为默认的结算层,因为没有其他方案能够同时满足机器对机器商业所需的交易量、速度和精细度。
在这一阶段,差异化因素不再是谁拥有最好的模型或最快的链。真正重要的是谁构建了最值得信任的基础设施。智能体所持有的“护照”,用于裁决纠纷的“法院”,以及让智能体能够在其即时余额之外进行交易的信用系统。这些面向软件的制度将决定哪些智能体能够参与经济活动,以及以什么样的条款参与。
我们在还没有建立任何验证代理是否应该被允许花钱的机制之前,就已经为代理搭建了花钱的管道。HTTP 402 休眠了三十年,一直等待微支付变得有意义。现在它成立了。但支撑人类商业的信任基础设施——包括身份核实、欺诈检测和纠纷解决——却缺乏对应的代理版本。我们先解决了简单的问题。在代理彼此之间做好开展商业活动的准备之前,还需要一段时间。