AI 采用率的数据分析

原文链接： AI Adoption by the Numbers

作者： a16z

免责声明： 本翻译仅供个人阅读和学习参考，不得用于任何商业用途或进行随意转载发布。

关于 AI 在大型企业中取得了多大实质性进展的猜测有很多，但现有的大部分信息仅包括自我报告的 AI 使用情况，或者是捕捉买家定性情绪而非硬数据的调查。此外，仅有的少数几项研究断言 AI 在企业中表现不佳，最著名的是麻省理工学院（MIT）的一项研究，该研究声称 95% 的生成式 AI 试点项目未能转化。

基于我们的内部数据和与企业高管的对话，我们发现这一统计数据难以置信。我们一直在密切跟踪 AI 在哪些领域获得了最大的采用率以及在哪些领域的投资回报率（ROI）最为明显，并编制了关于企业 AI 实际运作情况的硬数据。

基于我们的分析，财富 500 强中的 29% 和全球 2000 强中的约 19% 是领先 AI 初创公司的活跃付费客户。

为了符合这一统计标准，这些企业必须与一家 AI 初创公司签署了自上而下的合同，成功转化了一个试点项目，并在其组织内部上线了该产品。

在如此短的时间内达到这种渗透率是惊人的，因为财富 500 强企业并不以成为技术的早期采用者而闻名。历史上，许多初创公司最初必须向其他初创公司销售以获得早期势头，并且只有在几年之后，一家初创公司才能够获得其第一份企业合同，而在他们最终能够获得财富 500 强规模的客户之前，需要更多的收入和时间。

AI 颠覆了这一常态。OpenAI 于 2022 年 11 月推出 ChatGPT，并立即向消费者和企业展示了 AI 的潜力。在此过程中，他们引发了前几代技术从未引起过的对 AI 的狂热兴趣，大型企业愿意比以往任何时候都更早地押注于较新的产品。结果：仅仅 3 年多之后，近三分之一的财富 500 强和五分之一的全球 2000 强企业在其组织中进行了真正的企业 AI 部署。

这种采用在哪里发生得最快？它如何映射到模型天生更擅长做的工作？

我们发现评估这一点的最具指示性的方法是，将跨用例的收入势头与模型理论上的能力（由 GDPval 定义，这是 OpenAI 衡量模型在现实世界中有经济价值任务上的能力的一个著名基准）叠加起来。对我们来说，这两个因素概括了模型可以有多好，以及它们今天被证明能够交付多少价值。这非常生动地说明了目前 AI 的采用情况、它可能的发展方向，以及尽管模型能力已经成熟，但在采用方面仍然存在哪些 AI 悬念。

在收入势头方面，企业对 AI 的采用由一组明确的用例和行业主导。到目前为止，编程、支持和搜索占据了绝大部分用例（即使在这一组中，编程也是一个数量级异常值），而科技、法律和医疗保健行业则是最渴望采用 AI 的行业。

编程（Coding）：

编程是 AI 的主导用例，领先了近一个数量级。这在像 Cursor 这样的公司报告的爆炸性增长中非常清楚，以及像 Claude Code 和 Codex 这样的工具的高速增长中也是如此。这些增长率甚至超过了几乎所有人最乐观的预测，财富 500 强/全球 2000 强对 AI 工具的采用绝大部分在代码领域。

在许多方面，无论是就该技术能做什么，还是企业市场接受它的准备程度而言，编程都代表了 AI 的理想用例。代码是数据密集的，这意味着在线有大量高质量的代码可供模型训练。它也是基于文本的，使模型易于解析。它是精确且明确的，具有严格的语法和可预测的结果。至关重要的是，它是可验证的：任何人都可以运行它并知道它是否有效，从而为模型创建紧密的反馈循环以进行学习和改进。

编程能力正呈指数级提高，每个实验室都明确专注于赢得代码作为用例。这具有巨大的影响。代码是所有其他应用程序的上游，因为它是任何软件的核心构建块，因此 AI 对代码的加速影响应该会加速每个其他领域。在这些领域进行构建的底线降低了，释放了用 AI 解决问题的新机会，但同样的可访问性使得为初创公司建立持久的竞争优势比以往任何时候都更加关键。

支持（Support）：

支持位于代码杠铃的另一端。支持组织的性质决定了它是后台、入门级的工作，通常外包给离岸公司或业务流程外包公司（BPOs）。AI 已被证明在管理这项工作方面异常出色。大多数支持互动的性质是有时间限制的，具有受限的意图（例如，退款）。支持也是少数几个角色中涉及的任务被清晰定义的职能之一。支持团队具有明确的标准化操作程序（SOPs），这为 AI 智能体建模自己创造了明确的规则。

支持也是最清楚展示 ROI 的企业职能之一。它基于可量化的指标运作：回答的工单数、CSAT（客户满意度）得分和解决率。AI 代理能回答更多工单，提高解决率，并提高客户满意度——所有这些成本都更低。因为大多数支持工作已经外包，采用 AI 解决方案意味着有限的变革管理，使得采用路径容易得多。它也不需要 100% 的准确率才能发挥作用，因为它有自然的下线机制转交给人类。

搜索（Search）：

最后一个具有明确企业市场拉动力的横向类别是搜索。ChatGPT 的主要用例本身就是搜索。AI 搜索作为一个类别如此宽泛，以至于它催生了许多独立的大型初创公司。许多企业内部的主要痛点之一是使员工能够简单地定位和提取分散系统中的相关信息。Glean 已作为该用例的主要初创供应商而蓬勃发展。许多大型行业也依赖于非常具体的行业信息，像 Harvey（始于法律搜索）以及 OpenEvidence（始于医学搜索）这样的公司已经围绕着构建核心产品而蓬勃发展。

技术（Technology）：

到目前为止，最常采用 AI 的行业是科技行业。ChatGPT 报告称其 27% 的企业用户来自科技行业。

法律（Legal）：

令人惊讶的是，法律是 AI 领域首批采取行动的行业之一。法律以前被认为是一个软件难以进入的市场。但 AI 极其擅长解析密集文本、推理大量文本以及总结和起草回复——这些都是律师经常做的工作。Harvey 在成立 3 年内报告了约 2 亿美元的年度经常性收入（ARR），像 Eve 这样的公司拥有超过 450 个客户，并在今年秋天达到了 10 亿美元的估值。

医疗保健（Healthcare）：

像 Abridge、Ambience Healthcare、OpenEvidence 和 Tennr 这样的公司在医疗记录、医学搜索或后台自动化等离散用例的支持下，收入增长极其迅速。借助 AI，公司能够承担离散的人工劳动工作，从而绕过记录系统（如 EHR），无论是通过替换行政工作（如医疗抄写员）还是通过增强医生正在做的更高价值的工作。

为什么我们没有看到在这个评估（GDPval）中排名很高的所有行业都有其他人所拥有的那种收入势头？

到目前为止热烈采用 AI 的行业有几个相似之处：它们是基于文本的，涉及死记硬背和重复性工作，有自然的人在环参与以注入人类判断，监管有限，并且具有可清晰验证的最终输出（例如，可运行的代码、已解决的支持工单）。许多行业不具备这些属性。它们要么处理物理世界，要么严重依赖人际关系，在许多利益相关者之间有明确的协调成本，施加监管或合规障碍，要么缺乏可验证的结果。