分子机器:人工智能如何重写药物发现的经济学
在人工智能工具的众多应用场景中,药物发现领域堪称最佳之一。人工智能将以多种方式加速药物开发,从而拯救无数生命。
在所有药物发现工作的根本是科学家,他们试图设计能够以精确且可预测的方式与靶蛋白相互作用的分子。对于人工智能工具来说,这一领域是少有的试验场——在很短的时间内生成数十亿种分子与生物场景并模拟它们的相互作用的能力,是人工智能极其强大的应用场景。
Google 的 DeepMind 在这一生态系统的早期进展中发挥了重要作用。2024 年 5 月,他们发布了 AlphaFold 3。最初的 AlphaFold(2020 年)以近专家水平解决了蛋白质结构预测问题,被誉为生物学史上最重要的科学成就之一。AlphaFold 3 将这种能力扩展到预测几乎任何生物分子的结构——DNA、RNA、小分子、蛋白质——并关键地预测它们之间的相互作用。AlphaFold 3 使这种相互作用在计算上变得可解读,达到 24 个月前不存在的细节和精确度水平。
对此类进展的商业回应来得迅速。2024 年,Isomorphic Labs——DeepMind 于 2021 年孵化出的药物发现公司——与 Eli Lilly 和 Novartis 签署了合作协议,潜在里程碑付款总额高达 30 亿美元。Recursion Pharmaceuticals 同年晚些时候以约 6.88 亿美元收购了 Exscientia,将两个最先进的 AI 药物发现平台合并为一家拥有超过 35 个肿瘤学和免疫学活跃项目的公司。AI 药物发现的发展速度——以及与之相连的巨额资金——表明该领域已决定性地超越了概念验证阶段。
我曾撰文讨论 AI 在改造医疗服务中的作用: 就地养老 、由 AI 驱动的护理协调、对传统 EHR 系统的冲击。但药物开发位于这一切的上游,是一个价值 1.4 万亿美元的全球产业,其单位经济学是商业中最糟糕的之一。
药物开发的破碎经济学
平均获批药物需要 10 到 15 年的发育,总资本化研发费用约为 26 亿美元。自 20 世纪 50 年代以来,这一数字大约每九年翻一番——研究人员称之为“逆摩尔定律”(Eroom 定律),反映出一个令人不安的现实:尽管生物学知识不断扩展,制药研发却变得越来越低效。

大约 90%进入 I 期临床试验的候选药在达到食品药品监督管理局批准之前便失败了。即使是在成功完成 I 期和 II 期的化合物中,大约一半也会在 III 期失败——这是最后且最昂贵的阶段,单次试验往往耗资数亿美元。最常见的失败原因是疗效(药物效果不足)、毒性(出现意外安全信号)和患者选择(在错误人群中使用了合适的药物)。这些失败模式中的每一种至少部分上都可以通过人工智能来应对。
人工智能正在创造真正进展的领域
药物发现流程大致可分为四个阶段:靶点识别、化合物生成、临床前测试和临床试验。人工智能在每个阶段都带来了实质性优势。
-
靶点识别与生物建模: 找到合适的生物靶点——通常是其激活或抑制可治疗某种疾病的蛋白质——历来需要多年的学术研究。人工智能通过分析跨职能数据集来识别疾病机制并预测候选靶点的三维结构,从而大幅压缩了这一过程。这种结构理解是基础:如果不知道蛋白质的形状,就无法设计与之契合的药物。
在 AlphaFold 3 之外,近年来最重要的进展之一是 Chai Discovery,该公司于 2025 年 12 月完成了 1.3 亿美元的 B 轮融资,估值为 13 亿美元。Chai 的模型可以预测蛋白质复合体的三维结构——包括蛋白质与潜在药物分子如何相互作用——其准确性可与昂贵的实验方法相媲美。实际上,研究人员现在可以快速评估一个靶点是否“可成药”,并在投入任何合成工作之前模拟其可能对干预的反应。
-
分子生成与优化: 一旦确定了你的蛋白质靶标,哪个小分子或蛋白质疗法能以正确的方式与之相互作用?这就是分子生成与优化要解决的问题。类药分子的化学空间估计为 10 的 60 次方——远远大于可观测宇宙中的原子数。传统的药物化学通过迭代、假设驱动的合成来探索这一空间的极小一隅。人工智能模型现在可以在数小时内提出数千个具有指定性质的候选分子,在任何分子被合成之前对搜索空间进行计算筛选。
这里最近最重要的发展之一是 EvolutionaryScale 的 ESM3,这是一个于 2024 年发布的蛋白质语言模型。EvolutionaryScale 是一家从 Meta AI Research 衍生出的公司,该公司以“ESM3 代表蛋白质生物学的基础模型,就像 Claude 代表语言的基础模型”为论点,从 a16z 和 NVIDIA Ventures 融资 1.42 亿美元。早期工具旨在预测已存在蛋白质的结构,而 ESM3 能够生成具有指定性质的全新蛋白质序列。研究人员可以描述他们需要的功能并要求模型设计出新的东西,这可能会开启传统小分子化学无法触及的治疗手段。
-
精准病人筛选: 晚期临床试验失败的单一最昂贵原因是病人筛选:一种药物在特定人群中可能有效,但如果生命科学公司无法挑选出合适的候选者和对照组来证明该疗效,试验就会失败。得益于 AI 和更丰富的数据(可穿戴设备、电子健康记录信息共享),在招募第一位患者之前,试验就可以设定更为精确的入组标准。
像 Tempus AI——于 2024 年上市——这样的公司正在构建使 AI 驱动的病人分层在规模上成为可能的数据基础设施。但具体药物需要具体分层——例如,肿瘤学试验与中枢神经系统试验有很大不同。每个领域都需要专门的工具,许多公司能够且将会为此构建相应工具。
-
临床试验运营: 患者招募占据试验时间线的 30%至 40%。平均而言,III 期试验招募目标入组通常需要 2 至 4 年。将 AI 大规模应用于电子健康记录数据可以显著加速这一进程——基于实时临床数据在医疗系统中识别符合条件的患者,而不再依赖研究点协调员手动筛查病历。 食品药品监督管理局在 2025 年 1 月关于在药物开发中使用 AI 和机器学习的更新指南 ——该指南将其在 AI 辅助的试验设计和数据分析方面的方法制度化——为在试验运营中使用 AI 的申办方创造了更清晰的监管路径,消除了申办方面临的一项重大不确定性来源。
去中心化试验——允许患者通过可穿戴设备、居家样本采集和远程医疗就诊远程参与——也在 AI 的帮助下获得了两年前无法实现的优势。AI 可以监测来自远程参与者的连续传感器数据流,实时标记安全信号,并提前预测脱落风险,从而及时介入。去中心化与 AI 监测的结合正在使此前不切实际的试验设计变为可行。
谁来攫取价值?
AI 药物发现领域已经形成三种截然不同的商业模式。
完全整合模式——如 Recursion-Exscientia、Relay Therapeutics 和 Valo Health——利用 AI 发现候选药物并推进其进入临床试验阶段。这是潜在回报最高的模式,但也是资本密集度最高的模式。该类别近期的整合(以 Recursion 收购 Exscientia 为首要交易)反映出一种日益成熟的观点:要与大型制药公司的研发运作竞争,必须具备构建数据资产和临床管线的规模。
AI 即制药服务模式——以 Isomorphic Labs 和越来越多的计算生物学平台为代表——通过研究合作和以里程碑为基础的合作,为大型制药公司提供 AI 发现能力。Isomorphic 与 Lilly 及 Novartis 的合作代表了这一模式的成熟:大型制药公司愿意为获得顶级 AI 发现能力支付可观费用。
最后,还有垂直软件模式——为药物开发运营构建工具,例如临床试验管理、监管申报、临床数据分析、患者招募和生物标志物分析。这类公司从每一种正在开发的药物中产生收入,而不是依赖任何单一药物的临床成功。随着在研药物总数持续增长——部分由 AI 降低早期探索成本所推动——用于开发运营的软件可寻址市场也同步扩大。
我们今天处于何处?
人工智能药物发现已经明确证明,AI 能加速并改善早期药物发现。不过,我们尚未看到这如何转化为获批药物的成果。要得到这一证据需要时间,而在药物开发领域,时间以年乃至十年计。
还有一个任何程度的 AI 精细化都无法解决的结构性挑战:模型与人体生物学之间的鸿沟。我们对蛋白质与药物相互作用的计算模型仍未完全捕捉活体内发生过程的复杂性。AlphaFold 3 和 ESM3 大幅提升了我们建模分子相互作用的能力,但它们并未决定性地解决从细胞水平到患者疗效预测的转化性挑战。
数据质量与获取问题同样顽固。用于 AI 药物发现的最高价值训练数据仍然分散在医院系统、合同研究组织(CRO)和制药公司之间,各方在共享上缺乏一致的激励。通过自身临床运营构建专有数据资产的公司——例如 Recursion 通过其表型组学平台、Tempus 通过其肿瘤学数据网络——正在建立难以复制的护城河。
下一步是什么
未来一年多应关注的几点事项:
-
ESM3 和蛋白质生成模型将在未来 12–18 个月内产出首批治疗候选药物。它们将由一种从进化数据中学习到功能性蛋白质统计结构的模型生成。验证这些从未在自然界出现过的计算生成蛋白质是否具有治疗价值,将具有重大影响。
-
GLP-1 浪潮仍在扩展。每一季度都会带来关于 GLP-1 在更多适应症上疗效的新数据:心衰、睡眠呼吸暂停、肾脏疾病、成瘾,现在还有阿尔茨海默病。AI 正在积极用于挖掘现有试验数据以寻找额外信号、识别最有可能受益的患者人群,并为每个新适应症设计针对性的试验。
-
大规模医药并购即将到来。最顶尖的 AI 药物发现公司能做到的与大型制药公司内部所能构建的之间的差距正在拉大。这一差距价值数百亿美元的收购溢价。Isomorphic 的合作伙伴模式可能会成为全面收购的前奏。
争夺战已经开始,目标是为将决定老龄化人口健康状况的疾病开发安全有效的治疗方法。利用人工智能对抗阿尔茨海默病、心血管疾病甚至癌症,对这项技术而言将是一个奇迹般的积极成果——对能够掌握它的人来说,这也将极具经济回报。
药物发现领域的 IDD 飞轮才刚刚开始加速。那些通过研究工作流程积累专有生物和临床数据的公司,正构建将决定谁引领下一代医学的复利优势。