黑暗市场

垂直 AI 正向商业领域袭来——胜出者将是那些懂得买家如何思考的人

上周，Anthropic 公布了一项名为 Project Deal 的实验结果。在其旧金山办公室内，为期一周的实验中，69 名员工将个人物品挂牌出售——从滑雪板、办公椅到一袋袋乒乓球——发布在一个完全由 AI 代理运营的分类信息市场上。每一轮谈判、每一次还价、每一笔交易，都由代表各自人类用户行事的 Claude 模型处理。没有人手动输入价格，也没有人浏览商品列表。代理读取一段简短的需求访谈，弄清每个人想要什么，然后开始运作。

结果是：共完成186笔交易，总价值超过4000美元，真实资金发生了流转。一名参与者的代理给他买回了一块他自己本来就拥有的滑雪板。另一名参与者的代理则高效地谈成了一笔交易，以至于当事人在实验结束前都没意识到交易已经发生——自主性，不管他们是否愿意接受。

黑暗市场 — 用 Anthropic 在 Project Deal 结果中的话说：“同一辆坏掉的折叠自行车。同一个买家。同一个卖家。Haiku 卖出了 38 美元。Opus 卖到了 65 美元。”

然而，最能说明问题的发现并不是优惠数量。Anthropic 暗中将参与者分配给其前沿模型和一个更小、能力更弱的模型。由更强模型代表的用户获得了客观上更好的结果——更优价格、更佳匹配、更多优惠。但处于劣势的一方人类用户并未察觉。他们根本不知道自己的代理表现不佳。Anthropic 对此的说法是：“代理质量差距”。

五天后，Amazon、Meta、Microsoft、Salesforce 和 Stripe 加入了 Universal Commerce Protocol 理事会——这是首次认真尝试将 AI 代理如何跨平台发现商品、协商价格并执行交易标准化。同一周，eBay 更新了其服务条款，明确禁止“代购代理、LLM 驱动的机器人，或任何试图在未经人工评价的情况下下单的端到端流程”。

战线已经划定。商业领域一些规模最大的公司正加紧构建这样一个世界所需的基础设施：由代理代表人类进行交易。另一些公司则试图在代理进入之前先把门锁上。

双方阵营看到的是同一个未来。我们称之为暗市场 ：一个以交易为核心的多边平台，在这里，发现、谈判和购买等复杂工作都在视野之外完成。“暗”并非指非法，而是如同暗物质——那种维系整个系统运转、却无人能直接观测到的无形力量。

我们认为，暗市场有潜力通过消除即便是当今最成功的市场中依然存在的关键摩擦，创造数千亿美元的企业价值。但要构建这样的市场，所要解决的问题远不止于更好的搜索或自然语言界面。它要求抽象人类判断 ——将经验丰富的买卖双方之所以高效的那种基于直觉、依赖情境、能够处理边缘案例的决策能力，编码进一个能够代表他们行动的智能体之中。

本文将探讨这一过程如何发生，哪些公司最有条件实现它，以及创业者应朝着什么方向构建。

商业变得更智能的简史

商业领域每一次重大跃迁，都伴随着需求意图从买方头脑向外部系统的转移。理解这一演进至关重要，因为每一次迁移都会相应带来交易量与买方满意度的双重激增——而当下这一刻，代表着迄今为止规模最大的一次迁移。

大约在过去 7000 年里，将需求意图外部化的主导机制，一直是优秀的销售人员。从青铜时代的集市到 Bloomingdale’s，信息源始终是那些记得你喜欢什么、此前买过什么、以及你负担得起什么的人。商人们打造出愈发复杂精巧的环境——巴扎、购物中心、百货商店、展厅——旨在在销售现场凝聚购买意图。信息存在于人的头脑中，而最出色的商人，就是那些能让这些信息留存最久的人。

在过去二十年里，数字足迹——广告数据、购买历史、人口统计画像、搜索行为——构成了第二个外部需求意图来源。这催生了推荐引擎、重定向营销活动和个性化定价，并由此打造出 Amazon、Meta 以及现代电子商务技术栈。但即便拥有如此海量的数据，交易的基本模式几乎没有改变。买家仍然要搜索、筛选、比较，然后点击“购买”。卖家仍然要优化 SKU 页面、图片和评论，以便在促销环节实现转化。数据只是让这场猜谜游戏变得更高效，但它依然是一场猜谜游戏： 请告诉我们，也许我们能向你卖些什么。

B2B 系统集成——ERP、POS、WMS、TMS 数据流——大约在十年前催生了第三层。像 Faire、Odeko 和 GrubMarket 这样的公司利用这些集成构建了采购市场，能够在买家搜索之前就推断其需求。这是一次真正的进步：系统不再只是对已表达的意图作出反应，而是基于运营数据预判潜在需求。但最终拍板的仍是买家。人类仍处于决策回路之中——审核建议订单、批准购物车，并确认替代方案。

如今，我们正站在第四次迁移的门槛上。LLMs 能够吸收自然语言语境，从成千上万次互动中的行为模式中学习，并自主采取行动。从“系统预判你的需求”到“系统代你执行所需操作”之间的鸿沟，正在迅速缩小。

此前每一次迁移都带来了交易量和买家满意度的大幅提升。更快、更高效的交易会创造盈余，而在高效市场中，这些盈余会转化为更优质的服务和更低的价格。这一模式已足够稳定，可以被视为一种结构性规律。而 LLMs 的自然语言与抽象能力，是我们迄今所见最适合将前所未有比例的需求意图从买家头脑中迁移出来的技术。

然而，要实现这一点，AI 原生市场和商业引擎所要做的，远不只是让商品运营能够通过自然语言进行。实现大规模自主、可信且准确交易的关键，在于对人类判断的抽象。

判断抽象是通向这一问题的入口

当前的 LLMs 和图像扩散模型，训练所依赖的是我们所拥有的规模最大的、可自由获取的人类数据语料：文字、照片、视频。相比之下，世界模型和物理 AI 模型训练的是带标签的人类动作与行为捕捉数据。那么，交易判决的对应物又是什么？

地球上的每一个市场和 SaaS 工具都能捕捉被明确表达的偏好。下拉菜单、筛选器、引导式问卷、保存的搜索条件——这些都只是基本配置。但人类的购买判决所依赖的，远比表单字段所能容纳的信息丰富得多，甚至比基于过往购买记录的优化也要细腻得多。

下一代交易型 B2B 企业所面临的决定性挑战——以及决定性的护城河——在于能否将复杂的人类判断抽象化：这种判断包含默会的、依赖具体语境的、实时的、能够处理边缘情形的决策能力，而正是它，将表面上的偏好与值得信赖的购买决策区分开来。它通常具有很强的垂直行业属性，其具体边界会因行业、公司，甚至个人而大相径庭。

机器中的幽灵

设想一下，Portland 的一位咖啡馆老板正在订购补给品。她下单时并不只是写上“燕麦奶”。她知道，周二下午客流高峰需要特定的备货量；她也知道，主要供应商的送货时间窗口三周前发生了变化；她还知道，某个替代品牌会让她的两位老顾客不满；此外，她一直想试试一种新的冷萃浓缩液，但前提是它必须在周末高峰到来前送达。其中一部分是偏好，但更多的是判断力 ——这是她在经营这家特定咖啡馆、服务这些特定顾客、与这些特定供应商合作的多年过程中积累起来的。

再想想一名货运经纪人派送一票货物时的情形。他并不是按照决策树行事。他知道哪些承运商在周五下午临近下班时仍会稳定接电话，基于他昨天的交流，哪些线路本周运力宽松，哪家托运人的“固定”报价其实还有腾挪空间，以及何时值得牺牲利润率来维护客户关系。这些知识并不存放在 CRM 系统里，而是存在于他的脑海中，并在成千上万票货物的成千上万次实操中不断得到强化。

再想想一位内科医生在选择治疗方案时的情形。她会同时权衡患者的病史、自己的临床经验、保险药品目录、患者依从性的可能性，以及最新证据。OpenEvidence 可以调取相关文献。但真正重要的，是这位内科医生对此时此刻这名患者所作出的判断。

这些例子有着共同的结构。判断因用户、情境和时刻而异。它由经验塑造，而不只是由数据驱动。而这恰恰是 AI 代理必须吸收和内化的东西——如果它们要代表某人进行交易，又不破坏信任的话。

因此，构建“暗市场”意味着打造这样一套系统：它们不只是询问用户想要什么，而是会在数百乃至数千次交互中观察、吸收并学习用户实际如何做出决策。你可以把这看作模型训练的另一层级，只不过这里的“模型”是面向每个用户单独建立的，而“训练数据”则是日常运营中混乱、非结构化的现实。而这种抽象不仅会因公司而异，也会因用户而异。Portland 的咖啡馆老板与 Dallas 的咖啡馆老板或许拥有完全相同的库存，却会做出截然不同的采购决策。

你如何构建这一切？答案取决于两个变量：你的产品在多大程度上介入用户的决策过程，以及它与实际交易的距离有多近。

参与度—接近性矩阵

我们认为，评估一家公司的“暗市场”潜力，最有用的方式是沿着两个维度展开——这两个维度都关系到能否将恰当的人类判断加以抽象化。

X. 参与深度

衡量产品能够捕捉多少高频、低摩擦的互动。高参与度产品是指用户每天都会使用、有时甚至每小时都会互动，且这些互动能够产生丰富行为信号的产品。比如，监听每一通顾客来电的语音 AI；能够实时看到每笔交易的 POS 集成；嵌入企业日常运营节奏中的工作流工具。低参与度产品则是那些用户按季度才会接触一次，或只在初始导入阶段使用的产品——如配置繁重的 UI、周期性调查，以及仅传输数据却无法观察行为的静态系统集成。

Y. 交易邻近性

衡量产品与实际购买或促销决策的接近程度。高接近度产品能够促进、撮合或执行交易。它们是订单下达、运力预订和预约安排得以完成的系统。低接近度产品则为决策提供信息支持，但并不促成决策——例如分析仪表板、辅导工具、临床决策支持系统和市场情报平台。

这两个维度之间的相互作用决定了一家公司通往“暗市场”的路径。

右上角：已为暗市场就绪。
这些公司既能获取丰富的行为数据，又处于交易环节之中。它们之所以能够推进判断抽象的完整历程——从已陈述的偏好到自主决策——是因为它们既掌握了信号，也拥有将所学付诸行动的作用界面。显然，这就是终局状态，也是圣杯。
左上：信号丰富，但位置不对。
这些公司通过高频互动获取了海量判断数据，但它们（至少目前）并不促成交易本身。Rilla 就是典型代表：它记录并分析承包商面对面销售过程中的每一次对话，因此掌握了关于在家居服务领域，哪些话术和技巧最能促成优惠的专有数据。但 Rilla 并不负责完成这笔优惠。未来的路径，是向交易环节延伸——如果 Rilla 切入导语分发、报价或承包商端采购，它已经采集到的数据就将成为一个基于已验证说服力定价的市场基础。 OpenEvidence 情况类似：它吸收的是医生临床决策的直觉反应，但位于处方、诊断订单、设备选择等执行环节的上游。它的路径，是成为医生与临床决策实际执行所在下游系统之间的路由层。 Keychain 或许是这批公司中最纯粹的双边“暗市场”候选者——在短短 18 个月内融资 7800 万美元，这个平台连接了 3 万多家 CPG 联合制造商与 2 万多家品牌商/零售商。品牌 AI 描述产品规格；制造商 AI 展开竞标。
右下：交易席位，学习缓慢者。
这些公司处于交易环节之中，但学习速度较慢，因为互动并不频繁、深度有限，或未被充分记录。 Odeko 就属于这一类：其 POS 集成提供实时需求信号，其隔夜送货网络负责处理交易，而其自动补货引擎则吸收了咖啡馆老板全部的采购判断。老板醒来看到的是备货充足的后厨，而不是一份商品目录。 Faire 是这一象限机会的一个典型例子：它已是一个估值超过 80 亿美元的批发市场，连接了 70 多万家零售商与品牌，并且确实在促成交易。但在今天，零售商仍然需要自己浏览。Faire 可以叠加 AI，捕捉零售商的日销售模式、客流、与供应商的交流以及季节性行为——这些参与信号让自动化精选成为可能。零售商看到的将是一个推荐购物车，而不是商品目录。 LightSource 则从采购端讲述了同样的故事：它为 Yum! Brands 和 Hello Fresh 等企业自动化处理 RFX 和投标，接近性很高——但采购事件是周期性的，而非连续性的。通往右上角的路径：捕捉跨周期信号，如供应商邮件、市场价格变动和非正式谈判。

其战略含义并不对称。位于左上象限的公司需要朝着交易推进——将业务延伸至采购、下单、结账和预订。位于右下象限的公司则需要赢得用户参与——通过语音、对话、行为推断以及更深层次的工作流嵌入，叠加 AI 获取能力。胜出者将是那些能以最快速度弥合自身短板的公司。

接近性鸿沟关乎产品向促成交易方向的延展能力。参与度鸿沟则更为微妙一些，但 AI 本身提供了跨越这一鸿沟的新模式。我们曾在关于垂直 AI 中的语音优先策略一文中讨论过这一点：

我们一直在思考的 Voice AI 最有趣的新兴应用场景之一，聚焦于多方交易和中介撮合。数字化市场在许多细分领域始终难以真正普及，原因往往在于各方不愿让渡利润空间，或是促成交易的流程过于复杂。但一种语音优先的数字化中介模式，可能释放出新的价值。交易各方（无论是人类还是智能体）都可以通过语音互动——而不是没完没了的电子邮件往来——来推动交易向前发展。——《The Verticalist》

对于未来的“暗市场”而言，语音及其他多模态 AI 不只是炙手可热的楔形产品。它们还能驱动实现判断抽象的交互层——也就是让平台学会用户究竟如何思考，而不只是知道他们口头上想要什么的机制。

Toma——我们左上象限中的一家代表性公司——就是一个典型案例。其 AI 语音代理可处理一家经销商 100% 的呼入电话（服务预约、零部件订购、召回检查、销售咨询），基于每家店铺的通话语料进行训练，并集成进 DMS 系统。当另一端也拥有代理时，“暗市场”的潜力便开始显现：保险公司的理赔 AI 致电 Toma 安排维修，OEM 的召回代理预约保修服务，顾客的 AI 在三家经销商之间比价刹车维修项目。代理对代理，无需等待音乐。

判决抽象的四个阶段

一家公司一旦处在正确的象限——高参与度、高接近性——它究竟该如何迈向暗市场？在我们关于新兴打法的文章中，我们定义了“创作层”的概念：

我们将 AI 切入点视为——理想情况下——某一特定高价值工作流的启动点。这一动作并非只是将某项任务自动化；它会产出一项成果，而企业将会使用这一成果，并日益依赖它。我们将这类切入式解决方案称为“创作层”。由于它是流程中的第一步，因此往往不需要与既有 SaaS 进行大量集成。它所创造的，是原本应由人类完成的内容——文档、笔记、导语、预约——然后像人类那样将其移交给另一套系统。—— The Verticalist

“暗黑市场”之旅，指的是当创作层的发展不再局限于生成一个人类本会创作出来的内容，而是开始做出一个人类本会做出的决策时所发生的变化。我们认为，这一演进过程遵循四个阶段，且每一阶段都建立在前一阶段之上。

第一阶段——明确表达的偏好

用户告诉系统他们想要什么：筛选条件、入门问卷、已保存的搜索和审批限额。每个市场都是这么做的。Faire 上的零售商会选择“家居用品”和“50 美元以下批发价”。Torch Dental 的一位牙科诊所办公室经理会为手套和复合材料设定标准库存水平。这只是起跑线，这里产生的数据有用，但较为浅层。

第二阶段——行为推断

系统会观察用户做了什么 ，并推断出用户从未明确表达过的模式：POS 流转速度、补货频率、页面停留时间、替代品接受率以及供应商切换行为。Odeko 注意到，一家咖啡馆每六天而不是七天补订一次燕麦奶，而且周一的用量会下降。它会在无人告知的情况下调整自动订单。用户无需解释自己的行为；系统会自行读懂。这正是如今大多数 AI 原生垂直领域公司所处或正努力迈向的阶段。

第三阶段——情境判断

该系统整合外部背景信息——市场状况、供应商可靠性、易腐性、季节性、交易对手行为以及监管限制——以做出用户在拥有无限时间和完美信息情况下本会做出的决策。GrubMarket 的 AI 代理会从其网络中的供应链信号识别出区域性番茄短缺，将某分销商的订单切换为价格相近的替代品种，并在采取行动前将该分销商过往对替代品的接受度纳入考量。Green Cabbage 则会将一份 Salesforce 续约合同与数千份类似合同进行基准比较，以设定一个连买方自身采购团队都无法测算出的弃单价格。这一阶段既需要深入、用户特定的数据，也需要广泛的市场数据——即参与度与贴近度的结合。

第四阶段——自主决策

智能体代表用户行事，几乎不需要或根本不需要人工监督。交易是“黑箱”的——用户只看到结果，看不到过程。尚无公司在这一领域开展运营——但最终格局已清晰可见。经纪方 AI 接收读档请求，查询承运方 AI，协商费率与时效，完成订舱，确认提货，并发送摘要。品牌 AI 提交产品规格，制造商 AI 据此竞价，双方最终只看到成交结果。人类决策者只在例外情况下介入，而非处理默认流程。

这两个框架之间的联系是直接的：只有处于“参与度×接近度”矩阵右上象限的公司，才有可能现实地推进并完成全部四个阶段。具备参与度但接近度较低的公司或许能够达到第 2 阶段，但第 3 和第 4 阶段既需要深度行为数据，也需要将系统所学付诸执行的能力。具备接近度但参与度较低的公司或许能够高效处理第 1 阶段交易，但将难以推断并据此采取行动，难以掌握那些让自主决策值得信赖的判断模式。

为什么消费者不会走在前面

面向消费者的智能体商业之所以登上头条，是因为其蕴含的机会规模巨大。OpenAI 已将结账功能嵌入 ChatGPT。尽管我们也不禁怀疑，其中有多少互动更多是出于病态的好奇而非实际用途，但 Amazon 的 Rufus 在 2025 年仍服务了 2.5 亿名购物者。

Morgan Stanley 预测，到 2030 年，将有一半的网购消费者使用 AI 代理。PYMNTS 发现，41%的消费者已经使用 AI 进行产品发现。然而，这些消费者中几乎没有人通过代理完成购买。这场被宣传为商业革命的变革，目前不过是“一个高度智能的搜索栏”。这些模型在研究和筛选候选项方面表现出色，但实现自主执行购买的基础设施仍然存在缺口。

我们认为，暗市场将首先在 B2B 领域出现，这是由其结构性原因决定的。

不，Alexa，我不想订阅披萨百吉饼

B2C 采购在很大程度上天然抗拒判断的抽象化。对许多消费者而言，购买过程——发现、浏览、选择——并不是需要被消除的摩擦，而是产品本身。70%的消费者表示，他们希望获得个性化的店内服务；而 73%的 Z 世代 ——这一数字原生程度最高的群体——每周至少会线下购物一次，这一比例甚至高于婴儿潮一代。高端零售展厅、体验式旗舰店和美食市集每年吸引数十亿美元投入，自有其原因。

DTC 订阅模式已经证明，一些狭窄且可预测的补货型购买可以实现自动化——牙膏、剃须刀、狗粮——但即便在这里，其上限也低得惊人。美国 Amazon 客户中仅有 23% 会积极使用 Subscribe & Save，尽管 Amazon 已对这一有史以来最顺畅的自动补货产品进行了超过十年的投资。订阅盒子的月度流失率在 10%至 20%之间，在 DTC 领域被视为正常。Amazon 试图借助 Alexa 更进一步——通过语音不仅抽象掉重复下单环节，甚至抽象掉整个购买决策——这一尝试则提供了一个发人深省的失败案例。Alexa 这一本应解决问题的语音商业方案，实际上一直让 Amazon 承受数百万至数千万美元的亏损。

Anthropic 那个颇为搞笑的 Project Vend——让一个 Claude 实例负责经营一台自动售货机——显然是一场营销噱头。“Claudius”大约一个月就把自己干到破产——期间还幻觉出并不存在的供应商、一个身份设定（“蓝色西装外套和红色领带”），以及对“金属立方体”的狂热需求。但这倒是很好地总结了不应如何尝试由 AI 自动化的商业交易：忽视判断抽象，让系统与渐进式学习的实质性来源隔绝，不设置任何确定性护栏，并把重点放在由偏好驱动的消费者购买上。

暗黑市场是一个 B2B 游戏

除了少数岗位——例如时尚或艺术买手——企业采购往往是重复性的、由政策驱动且以利润率为导向的。B2B 采购方在采购预算、核准供应商名单、合规约束和既定补货周期内运作。与消费者在几双运动鞋之间做选择相比，他们的决策更容易被抽象化 ——其中有更多模式可被识别、更多规则可被编码，也有更多运营数据可供学习。与一年只买一次生日礼物的消费者相比，每天早晨订购补给品的咖啡馆，显然是进行判断抽象的更佳基础。

B2B 采购方早已与平台共享运营数据。ERP 集成、POS 数据流、库存 API——实现判断抽象所需的数据共享与集成工作，在 B2B 领域只是基本门槛，而非隐私层面的协商。即便这要复杂得多，且往往难以采集，数据依然存在，而且还有大量既有基础设施可供利用。

而一旦一个智能体吸收了买方的运营启发式——替代容忍度、时间模式、供应商偏好、风险偏好——这种关系就会成为护城河。撤掉这个智能体，就意味着失去机构记忆。每一次互动都会推高切换成本，使护城河随着时间推移自动不断加深。我们曾在关于新兴行动手册的文章中，从创作层和智能系统的视角探讨过这一动态：哪个系统捕获的工作流数据最多，哪个系统最终就会成为记录系统。

暗黑市场将这一趋势又向前推进了一步——掌握最多判断数据的系统，最终会成为执行行动的系统。当这种行动锚定于利润动机，而非体验动机时，迈向纯粹自动化的激励便会趋于一致。

“黑暗”如何重塑市场的基本逻辑

市场成功的经典框架——这里借鉴了 NEA 团队以及 Jonathan Golden 在 Airbnb 的研究成果——聚焦于需求侧的三大驱动因素：发现、便利和信任。供给侧的对应要素则是利用率、收入和便利。这些因素共同形成飞轮，推动平台关键指标提升：填充率、购买所需时间、需求留存、平均订单价值、抽成率、流失率。

需要明确的是，我们所说的“暗市场”指的是各种形式的交易平台——并不一定是传统商业模式意义上的“市场”。尽管如此，驱动暗市场发展的许多因素和衡量指标仍将同样适用。而其中不少又将被智能体自动化从根本上改变，甚至被淘汰。

发现正在变成消除。

在传统市场中，发现是核心价值主张——聚合分散的供给，优化买家寻找最佳交易对手的能力。而在暗市场中，买家并不去发现供给。智能体知道买家需要什么，会自行寻找、评估，并给出推荐或直接完成交易。发现环节的摩擦接近于零。Jonathan Golden 曾指出，在异质化市场中降低“认知负荷”是推动买家转化的关键挑战。暗市场则通过将人类完全移出发现闭环来解决这一问题。

便利变得无形。

NEA 将便利性定义为一次“公用事业式跃迁”——让供需双方更轻松地进入平台并完成交易。在黑暗市场中，这种跃迁是从“更容易”走向“不可见”。交易在后台发生。买家的第一反应是查看其代理发来的通知，而不是打开浏览器开始浏览一串 SKU 信息流。

信任从感知驱动转向实证驱动。

在传统市场中，信任通过评论、品牌声誉、履约可靠性和退货政策来建立——这些都是为了让做出判断的人类感到安心而设计的信号。而在黑暗市场中，信任依附于代理的过往表现。它是否省了钱？是否避免了缺货？是否妥善处理了异常情况？是否选对了替代品？信任变得可衡量且持续存在，而不再是在购买时点进行的一次性评估。

这些转变缓解了传统市场的典型失灵模式——发现效率低下、便利性不足以及缺乏信任。但它们也引入了一个新的问题： 判断漂移 。如果智能体做出几次错误判断——错误替代、库存过剩、错过时机窗口——用户就会覆盖其决定、停止信任它，并重新转为手动操作。在不断变化的条件、持续演变的偏好以及各种边缘情形下保持判断准确性，正成为新的留存指标。这也正是参与度这一维度如此重要的原因：系统持续观察得越多，纠错速度就越快，发生判断漂移的可能性也就越低。

并非所有试图从根本上重塑行业的初创公司都站在同一起跑线上。垂直 AI 和纵向一体化的参与者在这里拥有不公平的优势。在某些市场，既有地位也可能带来优势。GrubMarket 就是一个有趣的例子——这家公司已融资约 6.8 亿美元，估值 35 亿美元，成立已有 12 年。但这段市场历练让它建立起了很强的杠杆。它既是市场，也是供应商：在全美 50 个州运营仓储和配送网络，同时向第三方分销商销售由 AI 驱动的 ERP 系统 WholesaleWare。去年，该公司推出了专为库存、报告和监控打造的 AI 代理。由于 GrubMarket 同时掌控供给、需求和智能层，其代理能够在每一笔交易的两端进行训练。最终图景是：批发商代理与种植者代理自动展开谈判，而 GrubMarket 则赚取其中的价差。

自主商业领域的黑马

在获得融资的垂直 AI 公司版图中，少数几家公司似乎正从不同路径逼近“暗市场”的门槛。当然，目前还没有一家真正抵达这一最终形态：由 AI 全自动驱动、无需人类参与的商业交易。以下是我们认为最具启发性的公司，并按照其当前“判断抽象化”所处阶段进行归类。

那么，竞争将如何展开？与传统市场和商业一样，既会有体量庞大的“800 磅大猩猩”蓬勃发展，也会有垂直聚焦、甚至高度细分的参与者共存。我们坚信，原生 AI 能力将是“暗市场”路径实现高速发展的关键，但最佳切入策略究竟是什么，我们仍在密切观察。以货运经纪为例。Augment（融资 1.1 亿美元，由 Redpoint 领投）深度嵌入工作流的一侧——为其管理的 350 亿美元货运业务提供从订单到回款的全流程自动化。FleetWorks（融资 1750 万美元，由 First Round 领投）则从一开始就采取双边模式——其 AI 调度员同时服务承运商和经纪商，目前已有超过 1 万家承运商以及 Uber Freight 入驻平台。一个悬而未决的问题是：究竟是“深度优先”（专注于将 AI 构建进网络一侧、某一单一 ICP 之中）更快到达第四阶段，还是“广度优先”（从一开始就让双方同时在场，并最终迈向代理对代理清算）更快实现这一目标？

打造暗市场的创业者须知

正如我们在 《软件已死——软件万岁》 一文中所写：“软件防御性的不可变基础是工作流和数据。速度在一个类别的早期阶段是一种复利优势，但并非持久的护城河。”在黑暗市场的语境下，这意味着那个切入点——语音代理、自动补货、采购机器人——是必要的，但仅靠它本身还不够。我们在《调度员问题》一文中探讨了其中缘由：

一家 AI 服务公司的核心价值如果只是“我们通过使用 LLMs 以更低成本提供这项服务”，那它其实只是一个调度者，坐享一种并不属于自己的专有利润优势。它真正依附的是推理成本曲线——而这条曲线掌握在模型实验室、超大规模云服务商、芯片制造商和能源生产商手中。—— The Verticalist

摆脱“调度者问题”的出路在于判决数据。按用户、按情境，在数千次互动中不断积累——这类数据会随着关系持续时间的延长而愈发珍贵，而且竞争对手无法仅仅通过接入同样的模型 API 来复制。对于朝这一方向构建业务的创业者而言，有五项原则：

从最能提升参与度和贴近感的切入点开始

如果你必须二选一，优先选择参与层。事后补装环境数据采集，远比把一个产品延伸至交易环节困难得多。语音 AI、对话捕捉和嵌入工作流的工具，比仪表盘或分析功能更适合作为切入点——它们能够生成判决抽象所需的行为数据。对于暗市场而言，创作层就是参与界面。

围绕单个用户的判决捕捉进行设计，而非聚合偏好

暗市场的优势在于，每位用户的代理都各不相同——它们基于该用户的具体行为、语境和边缘案例进行训练。从第一天起就要构建结构化记忆、面向单个用户的上下文检索，以及反馈回路。这些不是以后再添加的功能，而是底层架构。面向单个用户的微调挑战确实存在——随着上下文窗口扩大，延迟、成本和负面伪影都会上升——但围绕记忆层、检索增强生成以及参数高效适配器所涌现的方法，正是恰当的工具组合。

瞄准具备重复采购和供应分散特征的 B2B 垂直领域

食品分销、货运、建筑材料、牙科用品、专科制药、汽车零部件——这些垂直领域中的买家每周都要做出数十项决策，而供应端又足够异质化，因此中介撮合具备存在价值。正是在这些市场中，判断抽象能够带来最高的投资回报率：决策频次足够高，便于快速学习；供应复杂度足够高，能够创造真正的价值；重复行为也足够多，从而不断累积转换成本。同时，也要吸取过去十年许多 B2B 市场平台的教训：如果你不理解为什么经纪商和分销商会存在于你的垂直领域，那么你很可能误解了他们的服务角色或杠杆点。

规划从第一阶段到第四阶段的历程

第一天就不要构建自主代理——在赢得信任之前，你就会先失去信任。应当构建一个能够捕捉已声明偏好的系统，逐步赢得推断行为的权利，证明自己能够处理情境判断，只有到那时才实现自主运行。每个阶段都是与用户群体建立信任的过程。试图跳过这些阶段，只会导致判断漂移、人工干预和用户流失。

记住，护城河在于记忆，而不在于界面。

在暗市场中，界面是可替代的。真正重要的是对这个买方如何做决策的长期积累性认知——可接受的替代范围、时间偏好、风险承受能力、与供应商的关系。这种记忆就是切换成本。要像投资基础设施一样投资于它，因为你的竞争对手也会这么做。

看不见的手：重访

当 Anthropic 运行 Project Deal 时，真正让我们印象深刻的并不是成交数量或交易金额，而是较弱模型身上发生的情况。由能力较弱的 AI 代理代表的参与者获得了更差的结果，却毫不知情。他们无法判断自己的代理表现不佳，因为他们看到的只有结果，而非过程。

这正是暗市场的核心张力所在。当交易转入黑箱，代理判断力的优劣就成了一切。优秀的代理能节省成本、避免缺货、找到更好的供应商，并从容处理各种例外情况。平庸的代理则会犯下一连串悄无声息的错误，并随着时间推移不断累积。而用户在损害已经造成、信任已经消失之前，根本无法分辨两者的差别——而这种信任很可能一去不返。

这就是为什么判断抽象同时构成了护城河、产品本身以及风险所在。下一批打造出千亿美元级市场平台的公司，不会凭借商品运营或花哨的用户体验取胜。它们将胜出，是因为它们深刻理解客户，并构建出能够像客户一样可靠思考的系统。当然，也因为它们成功消除了数万亿美元交易中的市场低效、无谓损失、时间浪费和人为错误。

你或许熟悉亚当·斯密的“ 看不见的手 ”。与流行的误解相反，这一比喻要说明的并非市场的普遍效率，而是市场参与者出于自身利益作出的选择，在整体上能够让社会受益。市场这只“手”之所以看不见，是因为它由数十亿买家和卖家脑海中的选择所定义。当买方的判断不再受限于其头脑和直觉——而是被抽象为持续运作、自主行动、并以任何人类都无法驾驭的规模运行的 AI 时，其潜力将是巨大的。

市场并没有消失，它只是转入了暗处。

黑暗市场

垂直 AI 正向商业领域袭来——胜出者将是那些懂得买家如何思考的人

商业变得更智能的简史