a16z Martin Casado：构建 AI 模型并没有那么难

这位技术专家兼投资人认为，人工智能近期的进展是一场堪比工业革命的重大事件，但他警告称，大型参与者筹集”廉价资金”的能力是有时限的。

Martin Casado 是一位技术专家和投资人，曾支持硅谷一些最知名的初创企业。他在 Andreessen Horowitz（亦称 a16z）领导一支人工智能投资团队；该公司是全球最知名、也最敢言的风险投资公司之一。

在职业生涯早期，Casado 曾在 Lawrence Livermore National Laboratory 从事核武器模拟工作，并在 2001 年 9 月 11 日袭击事件后，转向为情报界开展网络和网络安全研究。随后，他在 Stanford University 攻读哲学博士期间，协助开创了软件定义网络，使计算机之间的数据传输能够通过软件而非硬件实现。此后，他创办了自己的初创公司 Nicira Networks，并以逾 10 亿美元的价格出售。

在这场与英国《金融时报》风险投资通讯员 George Hammond 的对话中，他认为，AI 近期取得的进展是一场堪比工业革命的事件，但他警告称，行业内更大参与者筹集”廉价资金”的能力是有时间限制的，价值将迅速向下游转移。

「AI 改变了创新的本质——从工程问题变成了资本问题」

George Hammond： 我们当下正在经历的这轮 AI 周期，像不像你以前见过的某种情况？

Martin Casado： 有时我觉得它就像互联网一样，改变了社会秩序，因为你可以不受地理距离限制地与任何人交流。AI 让我想起这一点。它具有文化影响，也具有社会影响，它改变了人类与某种事物沟通和互动的意义。

有时我觉得它更像电力，甚至像工业革命，因为它似乎也彻底改变了创新的经济逻辑。比如就业市场，比如融资市场。互联网早期就有很多需求，但我们不知道如何将其变现。而在这里，感觉需求近乎无限，而且我们从一开始就在变现。

工业革命使世界摆脱了贫困，并成为一股强大的均衡力量。它解决了人类面临的许多严重问题。AI 也许会做到几乎同样的事情，只不过……方式会更加剧烈。

GH： 如果把时间尺度进一步压缩来看呢？工业革命是在几十年间逐步展开的，而这正在以几年为单位发生。这样的速度会带来什么后果？

MC： 这个问题我们其实并不知道，对吧？这项技术主要是为了提高人的生产率吗？在多大程度上，你可以用 AI 取代人类？在多大程度上，AI 根本不需要人类？它们会不会变成能够自主创办企业的独立实体？我认为我们对此完全没有证据，但我们正处在一项颠覆性技术之中。谁知道接下来会发生什么？

「”虚幻生产力”——AI 让我们感觉自己比实际更高效」

GH： 我们现在已经看到了一些生产率提升的迹象。是什么会推动这种趋势持续下去？未来几年这会呈现出什么样子？

MC: 其中最明显已经奏效的，就是代码。假设大约有 3000 万名职业软件开发者，他们的平均年薪是 10 万美元。这就是一个 3 万亿美元的市场。我的意思是，我们现在才刚刚进入这个庞大市场非常、非常早期的阶段。

如今，一名律师可以处理更多案件，医疗保健的准确性也会提高。我们知道，呼叫中心相关的应用已经奏效。我们知道，客户支持也已经奏效。但除此之外，还有一长串领域，我们还不太确定。

也可能出现这样一种情况：AI 让我们感觉自己的效率比实际更高。这是一种”虚幻生产力”。你有多少次和 ChatGPT 对话时，会觉得”这主意真不错”。然后你纠正它，它就会像……

GH：“这观察得很到位！”

MC： 没错。人们对 AI 带来的生产力提升的主观感受，与它们实际带来的生产力之间确实存在某种脱节，但毫无疑问，聊天机器人确实正在创造价值。

但我认为，当这一切尘埃落定时，这里的重大创新在于，我们实际上可以投入大量资金去解决某些类别的问题，而这是我们过去做不到的。

在我看来，AI 能否解决这个问题，如今已经是一个资本问题，而不是技术问题。如果我们回过头来看，问一句”这里最大的转变是什么？”我认为，关键在于我们把它从一个工程问题变成了一个资本问题。对我来说，这相当于工业革命级别的变化，因为它改变了创新的本质。

GH： AI 显然总体上非常有效，但在承担知识型工作、突破狭窄使用场景所需的各个方面，它的精确度还不够高。我们下一步该如何实现这一点？

MC： 预训练阶段，也就是投入大量资金去训练一个基础模型，这基本已经完成了。下一阶段是 RL（强化学习），开始攻克那些你拥有奖励信号的具体问题。我们现在正处于这个阶段。

所以我认为，问题已经不太是：它能不能应用于某个特定垂直领域？在大多数情况下，我觉得答案是可以。真正的问题是：这样做是否具备成本效益？

我认为行业目前处在这样一个阶段：电脑发展到某个节点后，制造一台电脑需要借助另一台电脑，从而产生了一种自催化效应。现在，我们也到了人们开始用 AI 创造 AI 的阶段。反馈循环将从这里开始形成，而这往往会大幅拉低你所做事情的价格。

「你面对的是我们见过折旧速度最快的资产」

你面对的是我们见过折旧速度最快的资产，以及增长速度最快的公司。而且没有人能够回答，这最终会在何处趋于稳定。

GH： 谈到资本问题，大型 AI 实验室融资规模之大、营收增长之快，都超过了以往任何一代初创公司。但它们仍在亏损。你如何看待这个问题？

MC： 是的，说实话，这才是最大的问题。如果你看一家前沿实验室相对于上一代模型训练轮次的经济性，它们看起来非常不错。但如果你看当前这一轮训练的经济性，情况就很糟糕。

你认为一个模型能保持多长时间的相关性？三到六个月。之后你就得进行下一轮训练，这些模型根本没有任何持久性可言。所以，你面对的是我们见过折旧速度最快的资产，以及增长速度最快的公司。而且没有人能够回答，这最终会在何处趋于稳定。

GH： 那么，作为 AI 公司的投资者，你如何破解这一难题？

MC： 我们必须对每一种潜在结果都有布局。一种情况是，大型实验室获取 80% 的价值。因此，你必须布局大型实验室。另一种情况是，在某个时点，市场会让这种烧钱行为回归理性。实验室将无法再以如此低的成本筹集这么多资金，随后价值会迅速向下游应用和较小模型转移。因此，我们也必须对此有所布局。

没有人能够预测未来，所以你必须对任何一条既定路径都有足够的布局。

最重要的是，AI 实验室能否筹集到比任何依赖它们的公司更多的资本？如果 Anthropic 融资 300 亿美元，整个下游生态加起来都筹不到这么多钱。我们谈论的资金规模大得惊人。但另一方面，模型的持久性又如此之低，我看不出它们如何能够维持这种局面。所以我认为，问题更多在于”它们还能继续吸纳这些资本多久？”在我看来，这才是关键问题。一旦这一切发生，世界将会非常不同。

GH： 那么，当我们走到那一步时，世界会是什么样子？

MC： 在某个时间点——我不知道那会是两年后还是六年后——市场会对此作出理性判断，并认为这里还存在其他机会，而你实际上是在为所有这些事情提供补贴。因此，廉价资金的流入将开始放缓。

到了那个时候，大型模型实验室将成为品牌垄断者，它们将在企业市场中掌握庞大的账户控制力，成为根深蒂固的既有巨头。但我认为，也正是在那时，它们的增长将显著放缓，而价值将向下游一层转移，也就是那些专注于特定垂直领域、应用、小型模型等方向的参与者。

「构建 AI 模型其实并没有那么难」

GH： 为了让这股热潮持续下去，模型开发的下一步会是什么，或者说还会出现哪些全新的架构？

MC： 我只是觉得，我们已经拥有了足够通用的工具来构建下一代产品。而我们仍在学习如何使用这些工具。我认为，我们已经越过了那个世界将要发生改变的事件视界。

如果说我有一个大胆观点，那就是：我做这件事越久，就越觉得构建这些模型并没有那么难。我认为，我们之所以会觉得”哇，这些太惊人了”，是因为这原本是一个相当小众的领域，从事这项工作的人并不多。

创新不再关乎巧思，而在于资源的聚集。

我一直看到一些非传统团队——也就是说，他们没有传统背景，没有哲学博士学位，也没上过 Stanford——在有资金支持的情况下构建出优秀的模型。这几乎就是：你能不能拿到数据？你能不能拿到电脑算力？这改变了创新的性质；创新不再关乎巧思，而只是关乎资源的聚集。

GH： 你投资过由 Ilya Sutskever [Safe Superintelligence] 和 Fei-Fei Li [World Labs] 创办的公司——他们都是这一领域最受瞩目的研究者之一。显然，在某种层面上，你相信创新来自非常顶尖的研究团队。他们所做的事情，与您刚才所描述的那种某种意义上的”靠蛮力推进”究竟有什么不同？

MC： 嗯，现实中有一个务实的规律：最有名的人会融到最多的资金。所以即便他们不是最有创造力的人，他们仍然能够拿到最多资金。还有一种情况是，最有名的人也能招到最顶尖的 20 个人。

我确实觉得，现在仍处于足够早期的阶段，因此你需要真正懂这件事的人。你现在确实必须拥有那些领域专家。这并不意味着你更聪明与否。你只是恰好当时就在那个房间里。

比如，恰好靠近 OpenAI 的那批人，本来也只是随机凑在一起的一群人，对吧？现在获取这些知识可能才是最难的，因为这一切还处于非常早期的阶段。

这些人确实掌握了渠道：Mira [Murati] 当时就在现场，Ilya 当时也在现场，Fei-Fei 在很多方面开创了深度学习。因此，他们拥有人脉网络，也能接触到相关知识。但随着时间推移，我们所有人都会获得这些，而这很可能意味着，这些事情并没有那么难，最终真的只会变成资本视角下的问题。

我这么说多少有点调侃，我也不是想把话说得太绝对，但这几乎与所有人的看法相反。大家都觉得，”这是那些天才大脑做的事，只有他们才能做到”。但实际情况也可能是，不，这些东西其实相当直接。它并没有演进太多。如果你能聚集起资金，那么很多人都能做。

「美国 vs 中国：自由市场对阵国家意志」

GH： 你曾撰文谈及美国与中国的 AI 竞赛。如果这确实是一场资本游戏，既需要私营企业投入，也需要政府承诺，那么谁会胜出？

MC： 中国拥有政府的全面投资，自由市场成分很少，并且能够非常高效地扫清监管障碍。在美国，我们有自由市场、自由资本、大量监管，却没有明显的办法来扫清这些监管障碍。我认为，这就是这场竞赛。

显然，如果政府能扫清监管障碍，美国就会占据绝对主导地位。

GH： 为什么美国击败中国如此重要，尤其是在模型优势只能维持数周而非数月的情况下？

我认为有三种可能的结果：美国胜出、中国胜出，或者双方都发展壮大并进入缓和共处状态。而我实际上更倾向于第三种：创新获胜，人类获胜，世界获胜。

MC： 如果说存在相互竞争的理念，我相信西方理念。所以如果你是在那个层面上问，这大致就是我的核心信念。

我认为有三种可能的结果：美国胜出、中国胜出，或者双方都发展壮大并进入缓和共处状态。而我实际上更倾向于第三种：创新获胜，人类获胜，世界获胜。

我并不需要美国在本土各个方面都占据绝对主导地位，但我们不能处于依赖中国的境地。

记住，我们在互联网时代就经历过这一切。我们创造了互联网。我们实际上拥有行业领先的公司，Cisco [Systems]、Juniper [Networks]。后来中国复制了它们，而且这对新兴世界产生了巨大的影响。中国影响力的范围不断扩大。你可以想象，在 AI 领域这种情况会更加明显。所以至少，我们不能依赖中国的 AI，而且我们希望让我们的盟友能够获得美国技术。

「Anthropic 事件：一家公司竟想控制政府的决策过程」

GH： 说到这个，我想谈谈美国 AI 公司与政府的角色。Anthropic 对阵 Pentagon 一直是那里的大新闻。你的职业生涯始于 Lawrence Livermore [National Laboratory，一个专注于核武器研发、隶属美国能源部的研发中心]。我总体上很好奇，在调动 AI 资源这件事上，你认为私营科技公司与政府之间的关系应该是什么样的？

MC： 9·11 之后发生的事情，与今天正在发生的情况之间有着很强的相似性。所以，9·11 发生时我其实就在 DoE [Department of Energy]，当时我在武器项目组，那有点像是冷战遗留下来的时代产物。

一切都变了：随着互联网以及随后恐怖主义的出现，威胁的性质发生了变化。而我们当时提出的许多同样的问题，今天也在被再次提出：我们知道恐怖分子正在利用互联网进行通信。我们如何找到他们，又如何在不监控美国公民的情况下做到这一点？这些问题完全一样。

当时事情最终的发展是，一些公司决定与政府合作，另一些则决定不与政府合作。而这两种选择都完全可以。然后我们算是一路摸索着走了过来。这一次，问题也完全一样：当法律尚未更新时，如何使用 AI？公司可以自行决定是否与政府合作。

但行不通的一点，也是这次不同之处在于，Anthropic 已决定他们想要合作，但实际上却要掌控政府的运营流程。一个独立公司竟然想真正控制政府的这一决策过程，这完全是前所未有、史无前例的。

所以我的个人看法是，不与政府合作完全没问题。不能接受的是说：”政府，你们不懂这项技术，所以我们来替你们做决定。”我认为现在被争论的正是这一点，对吧？顺便说一句，我认为 Microsoft、OpenAI，以及所有那些站出来为 Anthropic 辩护的公司，这么做都是错的，因为这件事截然不同。

GH： 为什么这件事不能像你刚才所说的那样，由政府直接表示”我们没必要合作，你们的服务条款与我们的预期不符，所以我们不会合作”来解决？他们为什么还要更进一步，作出供应链风险认定？

MC： 嗯，我认为 Anthropic 本来也可以做同样的事。他们完全可以只是决定不这么做，但他们并没有这样。Anthropic 当时是在试图保留对政府内部所发生事情的某种控制。

在我看来，正因为这项技术如此无处不在——这就进入 Martin 的个人观点范畴了——如果 Anthropic 表明自己愿意切断对关键基础设施的支持，而这也正是实际发生的事，那么你完全可以设想，这会被定性为一种供应链风险。

据我所知，这种情况在《爱国者法案》时期从未发生过……也就是”9·11″之后，没有哪家公司会说，”即便你依赖它，我们也会把它关掉。”而这里实际上发生的就是这种事，对吧？

这就好比 Cisco 说，如果我们不喜欢你们在做什么，即便那完全合法，我们也要把路由器关掉。或者说，就像电话公司那样。

GH： 这是不是另一种类似的类比，比如 WhatsApp 或 Telegram 说：”我们不会在自己的服务中植入后门”？

MC： 完全不同。

GH： 为什么这么说？

MC： 因为，能够拒绝提供某种被用于一次行动的东西，其性质与事后提供对某种东西的访问权限完全不同。你可以这样想：作战人员正在战场上、一次行动进行到一半时通信，而电信运营商却决定切断通信。这才是眼下这里正在发生的事情的恰当类比。

「AI 的掌控者想要比互联网时代更多的控制权」

GH： 撇开 Anthropic 合同的细节不谈，我真正好奇的是，这会如何更广泛地影响政府与 Silicon Valley 之间的合作关系。这会改变他们的合作方式吗？

MC： 我不这么认为。政府之间始终存在这种紧张关系。任何不愿与政府合作的公司，我都完全、完全尊重。我完全尊重他们，我也会投资他们。

我很高兴我们现在开始讨论这样一个问题：如果一家公司威胁要减少对关键基础设施的访问，会发生什么？

政府该怎么办？我认为我们需要弄清楚这一点，因为 AI 是一项非常强大的技术。

GH： 我认为，这恰恰印证了我们整场对话反复提到的一个主题：作为一种技术，人工智能的强大程度是我们此前从未真正遇到过的。

MC： 是的。也可能围绕 AI 存在一种我们尚未遇到、但影响力强大的意识形态。也许这与互联网完全类似。不同之处可能只是，运营这些事物的人相比当年建设互联网的人，更想掌握更多控制权。情况确实可能如此。

GH： 你认为那才是驱动他们的意识形态，而不是说他们只是比人们当年对互联网的影响更为恐惧吗？

MC： 我只是说，这种情况有可能发生。他们本可以更加恐惧，但问题就在于：在那种情况下，关键是意识形态，而不是技术。掌控技术的人不同，而不是技术本身不同。这种情况完全有可能出现。而我们在这里对此并不清楚。

GH： 这两者难道不是相互关联的吗？

MC： 有这种可能，但也可能情况是，这只不过像我们过去 70 年来一直在应对的任何其他电脑技术一样。你知道，只是围绕它形成了一些文化，把它看成并非其本质的东西，并借此在根本不了解其影响的情况下左右政府政策。我也不知道事实究竟如何。这也是为什么我其实很高兴现任政府正在展开这场讨论。这是一场非常健康的讨论。

也许事实证明政府完全错了，我对此完全持开放态度。也有这种可能。

本采访实录经编辑删节，以求简洁清晰。

a16z Martin Casado：构建 AI 模型并没有那么难

「AI 改变了创新的本质——从工程问题变成了资本问题」

「”虚幻生产力”——AI 让我们感觉自己比实际更高效」

「你面对的是我们见过折旧速度最快的资产」

「构建 AI 模型其实并没有那么难」

「美国 vs 中国：自由市场对阵国家意志」

「Anthropic 事件：一家公司竟想控制政府的决策过程」

「AI 的掌控者想要比互联网时代更多的控制权」

推荐阅读

糟糕的类比：并非每一家烧钱的公司都是 Amazon

Anthropic 首席执行官达里奥·阿莫代伊：“我不希望 AI 被用来对付我们自己人”

成立仅数月的初创公司 Recursive Superintelligence 已筹集 5 亿美元，用于开发自学习人工智能

Ronan Farrow 谈 Sam Altman 与真相之间“毫无约束”的关系

关于 Dwarkesh Patel 对 NVIDIA 首席执行官 Jensen Huang 的播客访谈

Mercor公司两位年仅23岁的亿万富翁创始人正努力应对员工欺诈和朝鲜渗透问题

a16z Martin Casado：构建 AI 模型并没有那么难

「AI 改变了创新的本质——从工程问题变成了资本问题」

「”虚幻生产力”——AI 让我们感觉自己比实际更高效」

「你面对的是我们见过折旧速度最快的资产」

「构建 AI 模型其实并没有那么难」

「美国 vs 中国：自由市场对阵国家意志」

「Anthropic 事件：一家公司竟想控制政府的决策过程」

「AI 的掌控者想要比互联网时代更多的控制权」

推荐阅读

糟糕的类比：并非每一家烧钱的公司都是 Amazon

Anthropic 首席执行官达里奥·阿莫代伊：“我不希望 AI 被用来对付我们自己人”

成立仅数月的初创公司 Recursive Superintelligence 已筹集 5 亿美元，用于开发自学习人工智能

Ronan Farrow 谈 Sam Altman 与真相之间“毫无约束”的关系

关于 Dwarkesh Patel 对 NVIDIA 首席执行官 Jensen Huang 的播客访谈

Mercor公司两位年仅23岁的亿万富翁创始人正努力应对员工欺诈和朝鲜渗透问题

了解 RecodeX 的更多信息