a16z Martin Casado:构建 AI 模型并没有那么难

这位技术专家兼投资人认为,人工智能近期的进展是一场堪比工业革命的重大事件,但他警告称,大型参与者筹集”廉价资金”的能力是有时限的。

Martin Casado 是一位技术专家和投资人,曾支持硅谷一些最知名的初创企业。他在 Andreessen Horowitz(亦称 a16z)领导一支人工智能投资团队;该公司是全球最知名、也最敢言的风险投资公司之一。

在职业生涯早期,Casado 曾在 Lawrence Livermore National Laboratory 从事核武器模拟工作,并在 2001 年 9 月 11 日袭击事件后,转向为情报界开展网络和网络安全研究。随后,他在 Stanford University 攻读哲学博士期间,协助开创了软件定义网络,使计算机之间的数据传输能够通过软件而非硬件实现。此后,他创办了自己的初创公司 Nicira Networks,并以逾 10 亿美元的价格出售。

在这场与英国《金融时报》风险投资通讯员 George Hammond 的对话中,他认为,AI 近期取得的进展是一场堪比工业革命的事件,但他警告称,行业内更大参与者筹集”廉价资金”的能力是有时间限制的,价值将迅速向下游转移。


「AI 改变了创新的本质——从工程问题变成了资本问题」

George Hammond: 我们当下正在经历的这轮 AI 周期,像不像你以前见过的某种情况?

Martin Casado: 有时我觉得它就像互联网一样,改变了社会秩序,因为你可以不受地理距离限制地与任何人交流。AI 让我想起这一点。它具有文化影响,也具有社会影响,它改变了人类与某种事物沟通和互动的意义。

有时我觉得它更像电力,甚至像工业革命,因为它似乎也彻底改变了创新的经济逻辑。比如就业市场,比如融资市场。互联网早期就有很多需求,但我们不知道如何将其变现。而在这里,感觉需求近乎无限,而且我们从一开始就在变现。

工业革命使世界摆脱了贫困,并成为一股强大的均衡力量。它解决了人类面临的许多严重问题。AI 也许会做到几乎同样的事情,只不过……方式会更加剧烈。

GH: 如果把时间尺度进一步压缩来看呢?工业革命是在几十年间逐步展开的,而这正在以几年为单位发生。这样的速度会带来什么后果?

MC: 这个问题我们其实并不知道,对吧?这项技术主要是为了提高人的生产率吗?在多大程度上,你可以用 AI 取代人类?在多大程度上,AI 根本不需要人类?它们会不会变成能够自主创办企业的独立实体?我认为我们对此完全没有证据,但我们正处在一项颠覆性技术之中。谁知道接下来会发生什么?

「”虚幻生产力”——AI 让我们感觉自己比实际更高效」

GH: 我们现在已经看到了一些生产率提升的迹象。是什么会推动这种趋势持续下去?未来几年这会呈现出什么样子?

MC: 其中最明显已经奏效的,就是代码。假设大约有 3000 万名职业软件开发者,他们的平均年薪是 10 万美元。这就是一个 3 万亿美元的市场。我的意思是,我们现在才刚刚进入这个庞大市场非常、非常早期的阶段。

如今,一名律师可以处理更多案件,医疗保健的准确性也会提高。我们知道,呼叫中心相关的应用已经奏效。我们知道,客户支持也已经奏效。但除此之外,还有一长串领域,我们还不太确定。

也可能出现这样一种情况:AI 让我们感觉自己的效率比实际更高。这是一种”虚幻生产力”。你有多少次和 ChatGPT 对话时,会觉得”这主意真不错”。然后你纠正它,它就会像……

GH:“这观察得很到位!”

MC: 没错。人们对 AI 带来的生产力提升的主观感受,与它们实际带来的生产力之间确实存在某种脱节,但毫无疑问,聊天机器人确实正在创造价值。

但我认为,当这一切尘埃落定时,这里的重大创新在于,我们实际上可以投入大量资金去解决某些类别的问题,而这是我们过去做不到的。

在我看来,AI 能否解决这个问题,如今已经是一个资本问题,而不是技术问题。如果我们回过头来看,问一句”这里最大的转变是什么?”我认为,关键在于我们把它从一个工程问题变成了一个资本问题。对我来说,这相当于工业革命级别的变化,因为它改变了创新的本质。

GH: AI 显然总体上非常有效,但在承担知识型工作、突破狭窄使用场景所需的各个方面,它的精确度还不够高。我们下一步该如何实现这一点?

MC: 预训练阶段,也就是投入大量资金去训练一个基础模型,这基本已经完成了。下一阶段是 RL(强化学习),开始攻克那些你拥有奖励信号的具体问题。我们现在正处于这个阶段。

所以我认为,问题已经不太是:它能不能应用于某个特定垂直领域?在大多数情况下,我觉得答案是可以。真正的问题是:这样做是否具备成本效益?

我认为行业目前处在这样一个阶段:电脑发展到某个节点后,制造一台电脑需要借助另一台电脑,从而产生了一种自催化效应。现在,我们也到了人们开始用 AI 创造 AI 的阶段。反馈循环将从这里开始形成,而这往往会大幅拉低你所做事情的价格。

「你面对的是我们见过折旧速度最快的资产」

你面对的是我们见过折旧速度最快的资产,以及增长速度最快的公司。而且没有人能够回答,这最终会在何处趋于稳定。

GH: 谈到资本问题,大型 AI 实验室融资规模之大、营收增长之快,都超过了以往任何一代初创公司。但它们仍在亏损。你如何看待这个问题?

MC: 是的,说实话,这才是最大的问题。如果你看一家前沿实验室相对于上一代模型训练轮次的经济性,它们看起来非常不错。但如果你看当前这一轮训练的经济性,情况就很糟糕。

你认为一个模型能保持多长时间的相关性?三到六个月。之后你就得进行下一轮训练,这些模型根本没有任何持久性可言。所以,你面对的是我们见过折旧速度最快的资产,以及增长速度最快的公司。而且没有人能够回答,这最终会在何处趋于稳定。

GH: 那么,作为 AI 公司的投资者,你如何破解这一难题?

MC: 我们必须对每一种潜在结果都有布局。一种情况是,大型实验室获取 80% 的价值。因此,你必须布局大型实验室。另一种情况是,在某个时点,市场会让这种烧钱行为回归理性。实验室将无法再以如此低的成本筹集这么多资金,随后价值会迅速向下游应用和较小模型转移。因此,我们也必须对此有所布局。

没有人能够预测未来,所以你必须对任何一条既定路径都有足够的布局。

最重要的是,AI 实验室能否筹集到比任何依赖它们的公司更多的资本?如果 Anthropic 融资 300 亿美元,整个下游生态加起来都筹不到这么多钱。我们谈论的资金规模大得惊人。但另一方面,模型的持久性又如此之低,我看不出它们如何能够维持这种局面。所以我认为,问题更多在于”它们还能继续吸纳这些资本多久?”在我看来,这才是关键问题。一旦这一切发生,世界将会非常不同。

GH: 那么,当我们走到那一步时,世界会是什么样子?

MC: 在某个时间点——我不知道那会是两年后还是六年后——市场会对此作出理性判断,并认为这里还存在其他机会,而你实际上是在为所有这些事情提供补贴。因此,廉价资金的流入将开始放缓。

到了那个时候,大型模型实验室将成为品牌垄断者,它们将在企业市场中掌握庞大的账户控制力,成为根深蒂固的既有巨头。但我认为,也正是在那时,它们的增长将显著放缓,而价值将向下游一层转移,也就是那些专注于特定垂直领域、应用、小型模型等方向的参与者。

「构建 AI 模型其实并没有那么难」

GH: 为了让这股热潮持续下去,模型开发的下一步会是什么,或者说还会出现哪些全新的架构?

MC: 我只是觉得,我们已经拥有了足够通用的工具来构建下一代产品。而我们仍在学习如何使用这些工具。我认为,我们已经越过了那个世界将要发生改变的事件视界。

如果说我有一个大胆观点,那就是:我做这件事越久,就越觉得构建这些模型并没有那么难。我认为,我们之所以会觉得”哇,这些太惊人了”,是因为这原本是一个相当小众的领域,从事这项工作的人并不多。

创新不再关乎巧思,而在于资源的聚集。

我一直看到一些非传统团队——也就是说,他们没有传统背景,没有哲学博士学位,也没上过 Stanford——在有资金支持的情况下构建出优秀的模型。这几乎就是:你能不能拿到数据?你能不能拿到电脑算力?这改变了创新的性质;创新不再关乎巧思,而只是关乎资源的聚集。

GH: 你投资过由 Ilya Sutskever [Safe Superintelligence] 和 Fei-Fei Li [World Labs] 创办的公司——他们都是这一领域最受瞩目的研究者之一。显然,在某种层面上,你相信创新来自非常顶尖的研究团队。他们所做的事情,与您刚才所描述的那种某种意义上的”靠蛮力推进”究竟有什么不同?

MC: 嗯,现实中有一个务实的规律:最有名的人会融到最多的资金。所以即便他们不是最有创造力的人,他们仍然能够拿到最多资金。还有一种情况是,最有名的人也能招到最顶尖的 20 个人。

我确实觉得,现在仍处于足够早期的阶段,因此你需要真正懂这件事的人。你现在确实必须拥有那些领域专家。这并不意味着你更聪明与否。你只是恰好当时就在那个房间里。

比如,恰好靠近 OpenAI 的那批人,本来也只是随机凑在一起的一群人,对吧?现在获取这些知识可能才是最难的,因为这一切还处于非常早期的阶段。

这些人确实掌握了渠道:Mira [Murati] 当时就在现场,Ilya 当时也在现场,Fei-Fei 在很多方面开创了深度学习。因此,他们拥有人脉网络,也能接触到相关知识。但随着时间推移,我们所有人都会获得这些,而这很可能意味着,这些事情并没有那么难,最终真的只会变成资本视角下的问题。

我这么说多少有点调侃,我也不是想把话说得太绝对,但这几乎与所有人的看法相反。大家都觉得,”这是那些天才大脑做的事,只有他们才能做到”。但实际情况也可能是,不,这些东西其实相当直接。它并没有演进太多。如果你能聚集起资金,那么很多人都能做。

「美国 vs 中国:自由市场对阵国家意志」

GH: 你曾撰文谈及美国与中国的 AI 竞赛。如果这确实是一场资本游戏,既需要私营企业投入,也需要政府承诺,那么谁会胜出?

MC: 中国拥有政府的全面投资,自由市场成分很少,并且能够非常高效地扫清监管障碍。在美国,我们有自由市场、自由资本、大量监管,却没有明显的办法来扫清这些监管障碍。我认为,这就是这场竞赛。

显然,如果政府能扫清监管障碍,美国就会占据绝对主导地位。

GH: 为什么美国击败中国如此重要,尤其是在模型优势只能维持数周而非数月的情况下?

我认为有三种可能的结果:美国胜出、中国胜出,或者双方都发展壮大并进入缓和共处状态。而我实际上更倾向于第三种:创新获胜,人类获胜,世界获胜。

MC: 如果说存在相互竞争的理念,我相信西方理念。所以如果你是在那个层面上问,这大致就是我的核心信念。

我认为有三种可能的结果:美国胜出、中国胜出,或者双方都发展壮大并进入缓和共处状态。而我实际上更倾向于第三种:创新获胜,人类获胜,世界获胜。

我并不需要美国在本土各个方面都占据绝对主导地位,但我们不能处于依赖中国的境地。

记住,我们在互联网时代就经历过这一切。我们创造了互联网。我们实际上拥有行业领先的公司,Cisco [Systems]、Juniper [Networks]。后来中国复制了它们,而且这对新兴世界产生了巨大的影响。中国影响力的范围不断扩大。你可以想象,在 AI 领域这种情况会更加明显。所以至少,我们不能依赖中国的 AI,而且我们希望让我们的盟友能够获得美国技术。

「Anthropic 事件:一家公司竟想控制政府的决策过程」

GH: 说到这个,我想谈谈美国 AI 公司与政府的角色。Anthropic 对阵 Pentagon 一直是那里的大新闻。你的职业生涯始于 Lawrence Livermore [National Laboratory,一个专注于核武器研发、隶属美国能源部的研发中心]。我总体上很好奇,在调动 AI 资源这件事上,你认为私营科技公司与政府之间的关系应该是什么样的?

MC: 9·11 之后发生的事情,与今天正在发生的情况之间有着很强的相似性。所以,9·11 发生时我其实就在 DoE [Department of Energy],当时我在武器项目组,那有点像是冷战遗留下来的时代产物。

一切都变了:随着互联网以及随后恐怖主义的出现,威胁的性质发生了变化。而我们当时提出的许多同样的问题,今天也在被再次提出:我们知道恐怖分子正在利用互联网进行通信。我们如何找到他们,又如何在不监控美国公民的情况下做到这一点?这些问题完全一样。

当时事情最终的发展是,一些公司决定与政府合作,另一些则决定不与政府合作。而这两种选择都完全可以。然后我们算是一路摸索着走了过来。这一次,问题也完全一样:当法律尚未更新时,如何使用 AI?公司可以自行决定是否与政府合作。

但行不通的一点,也是这次不同之处在于,Anthropic 已决定他们想要合作,但实际上却要掌控政府的运营流程。一个独立公司竟然想真正控制政府的这一决策过程,这完全是前所未有、史无前例的。

所以我的个人看法是,不与政府合作完全没问题。不能接受的是说:”政府,你们不懂这项技术,所以我们来替你们做决定。”我认为现在被争论的正是这一点,对吧?顺便说一句,我认为 Microsoft、OpenAI,以及所有那些站出来为 Anthropic 辩护的公司,这么做都是错的,因为这件事截然不同。

GH: 为什么这件事不能像你刚才所说的那样,由政府直接表示”我们没必要合作,你们的服务条款与我们的预期不符,所以我们不会合作”来解决?他们为什么还要更进一步,作出供应链风险认定

MC: 嗯,我认为 Anthropic 本来也可以做同样的事。他们完全可以只是决定不这么做,但他们并没有这样。Anthropic 当时是在试图保留对政府内部所发生事情的某种控制。

在我看来,正因为这项技术如此无处不在——这就进入 Martin 的个人观点范畴了——如果 Anthropic 表明自己愿意切断对关键基础设施的支持,而这也正是实际发生的事,那么你完全可以设想,这会被定性为一种供应链风险。

据我所知,这种情况在《爱国者法案》时期从未发生过……也就是”9·11″之后,没有哪家公司会说,”即便你依赖它,我们也会把它关掉。”而这里实际上发生的就是这种事,对吧?

这就好比 Cisco 说,如果我们不喜欢你们在做什么,即便那完全合法,我们也要把路由器关掉。或者说,就像电话公司那样。

GH: 这是不是另一种类似的类比,比如 WhatsApp 或 Telegram 说:”我们不会在自己的服务中植入后门”?

MC: 完全不同。

GH: 为什么这么说?

MC: 因为,能够拒绝提供某种被用于一次行动的东西,其性质与事后提供对某种东西的访问权限完全不同。你可以这样想:作战人员正在战场上、一次行动进行到一半时通信,而电信运营商却决定切断通信。这才是眼下这里正在发生的事情的恰当类比。

「AI 的掌控者想要比互联网时代更多的控制权」

GH: 撇开 Anthropic 合同的细节不谈,我真正好奇的是,这会如何更广泛地影响政府与 Silicon Valley 之间的合作关系。这会改变他们的合作方式吗?

MC: 我不这么认为。政府之间始终存在这种紧张关系。任何不愿与政府合作的公司,我都完全、完全尊重。我完全尊重他们,我也会投资他们。

我很高兴我们现在开始讨论这样一个问题:如果一家公司威胁要减少对关键基础设施的访问,会发生什么?

政府该怎么办?我认为我们需要弄清楚这一点,因为 AI 是一项非常强大的技术。

GH: 我认为,这恰恰印证了我们整场对话反复提到的一个主题:作为一种技术,人工智能的强大程度是我们此前从未真正遇到过的。

MC: 是的。也可能围绕 AI 存在一种我们尚未遇到、但影响力强大的意识形态。也许这与互联网完全类似。不同之处可能只是,运营这些事物的人相比当年建设互联网的人,更想掌握更多控制权。情况确实可能如此。

GH: 你认为那才是驱动他们的意识形态,而不是说他们只是比人们当年对互联网的影响更为恐惧吗?

MC: 我只是说,这种情况有可能发生。他们本可以更加恐惧,但问题就在于:在那种情况下,关键是意识形态,而不是技术。掌控技术的人不同,而不是技术本身不同。这种情况完全有可能出现。而我们在这里对此并不清楚。

GH: 这两者难道不是相互关联的吗?

MC: 有这种可能,但也可能情况是,这只不过像我们过去 70 年来一直在应对的任何其他电脑技术一样。你知道,只是围绕它形成了一些文化,把它看成并非其本质的东西,并借此在根本不了解其影响的情况下左右政府政策。我也不知道事实究竟如何。这也是为什么我其实很高兴现任政府正在展开这场讨论。这是一场非常健康的讨论。

也许事实证明政府完全错了,我对此完全持开放态度。也有这种可能。

本采访实录经编辑删节,以求简洁清晰。

了解 RecodeX 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读