关于 Dwarkesh Patel 对 NVIDIA 首席执行官 Jensen Huang 的播客访谈

有些播客一听就会让人觉得:“嗯,这一期我得好好拆解一下。”这期就是其中之一。那么,开始吧。

关于 Dwarkesh Patel 对 NVIDIA 首席执行官 Jensen Huang 的播客访谈

和往常的播客文章一样,最外层的要点列出受访者提出的关键观点,嵌套内容则是我的评论。有些观点会被略去。

如果我是直接引用,我会使用引号;否则请默认是转述 

和我上次分析的播客一样,Dwarkesh Patel 2026 年对 Elon Musk 的采访中,我们面对的是一位显然带着自身议程和立场发言的 CEO,而且他已被证明并不是一个可靠的叙述者。因此,我们必须考虑有限不信任的相关规则。

埃隆·马斯克是个特例:在某些方面,他充满技术洞见,也常有独特且有价值的看法;但在另一方面,他也会说出并不属实的话,往往还是他自己明知不实的话,还会对市场作出实际上概率接近于零的预测,并给出荒唐的数字和时间表。

黄仁勋则并非如此,过去他基本遵循更传统、边界分明的不完全信任原则。他会提出服务于自身利益、显而易见的荒谬论点,并使用强势的框架设定,但不会作出可被证伪的虚假事实陈述,也不会给出荒唐的预测。我认为他在这次采访中大体上也遵循了这一点,但其中有几处惊人之语,至少已经在擦边。

我并不为黄仁勋担心,我只是担心他。

充分披露:我是 Nvidia 的直接股东,持有其股票多头仓位。

【排期说明:每周 AI 帖子将于明天(4 月 17 日)发布,“知识截止点”为 Opus 4.7 发布之时。关于 Opus 4.7 的报道将于周一开始。】

播客概览(第一部分):普通商业访谈

这基本上是一场分为两部分的访谈。

前半部分,大约到第 57 分钟为止,我也会把结尾的最后几个问题算在这一部分里,主要围绕常规商业问题展开。NVIDIA 为何以及如何做出这些选择、这些投资、这些芯片分配决定?NVIDIA 的护城河在哪里?他们是如何思考这些问题的?

谈到这些问题时,毫无疑问,Jensen 是在为自己和 NVIDIA 大唱赞歌。CEO 们向来如此,也许有点过头,但除了顺带讽刺了一下所谓的“末日派”之外,这还算公平。

Jensen 淡化了 TPU 的作用,称其灵活性不如 GPU,包括缺少 CUDA,并表示这对于不同的 AI 架构也会产生影响。我不认同这种优势对很大一部分业务有那么重要。

他对 NVIDIA 如何分配芯片的解释似乎并不真诚,我总体上也并不相信他的这套说法,不过这类事情往往就是如此。

上半部分最有意思的内容,是他关于 Anthropic 的评论,尤其是 Anthropic 最终为何主要在 Tritium 和 TPU 上进行训练和运行。

Jensen 对 Anthropic 只有赞誉之词,他也承认责任在自己,眼看机会从手中溜走,并发誓不会让这种事再次发生。他原以为 Anthropic 会获得普通风投融资,因为他并不了解他们对算力的需求究竟有多大。因此,在早期阶段,Google 和 Amazon 进行了投资,并让 Anthropic 被锁定在那些替代性芯片生态系统中。之后他也乐于投资,但 Anthropic 当时已经为集成并使用其他芯片做了大量工作。

Jensen 错失 Anthropic,部分原因是当时手头缺乏自由现金,但更主要的是,他当时对“规模化”以及“AGI”的信念还不够强。如今他已认识到这一点,但调整仍不够充分。无论从哪个角度看,对于未来将要发生的事情,他的信念依然不算强烈。他声称,只要提前几年获知需求,他就能按自己的意愿大幅扩张整个供应链,但他却始终没有把扩张推进到足够程度。未来几年,电力将成为芯片销售一个新的潜在限制因素,但在此前,这一点并没有那么重要。

在前半部分,他丝毫没有流露出自己经营的并非一家普通计算机硬件公司的意思,除了这家公司在规模扩张上格外庞大、迅猛且盈利丰厚。

播客概览(下):一场关于芯片出口的辩论

这场访谈中人人都在谈论的部分是后半段,他们围绕向中国出口 AI 芯片展开辩论,而且气氛常常相当激烈。Jensen 当然希望把他的芯片卖到中国,而 Dwarkesh 则主张我们不应这样做,尽管他将这一立场表述为一种“唱反调”的观点。我的判断是,他大体上确实相信自己所提出的这些论点,只是也带着一些不确定性。

这是一场难度很高的访谈。Dwarkesh 在积极互动和不惧提出反驳方面做得非常出色。对话中有不少内容一度兜兜转转,但这似乎难以避免,而且往往也以其自身的方式揭示了许多东西。为这种敢于推进对话的做法点赞。

Jensen 试图两头都占。他的芯片确实好得多,但中国也已经具备其所需的全部芯片制造能力;中国拥有近乎无限的能源,原本要建的数据中心电力充足却空置着;但他们也可以转而使用更多性能较差的芯片;但美国又遥遥领先,我们不该为几笔芯片销售担心;可如果我们不卖这些芯片,就等于拱手让出全球第二大市场;而且模型架构既可以切换,也不能切换;我们的销售既不会影响中国获得算力的能力,又会成为他们是否继续留在 CUDA 生态的关键,诸如此类。

最重要的是,他反复把自己真正关心的事情说得很清楚。

关键只有一件事:Nvidia 向中国卖芯片。仅此而已。其他都不重要。这能让 Nvidia 和 CUDA 继续保持主导地位;而对 Nvidia 有利的,就是对美国有利的,因为只要任何东西是建立在他的芯片之上,那就是“好消息”,我们就赢了;反之,如果是建立在别人的芯片之上,那就是“坏消息”,我们就输了。

这实际上完全说不通。运行模型和应用程序的是谁家的芯片,并不是关键所在,这一点本应非常容易看清。但与此同时,芯片销售领域实际上并不存在真正的竞争,而且在很长一段时间内也不会出现,因为所有人都受制于算力限制,而中国即便生产性能差得多的芯片,其产能也严重受限。

按照黄仁勋的说法,我们是在牺牲构成 AI 这块“五层蛋糕”的其他层级,去让模型层受益;这不公平,也有害于美国,因为这意味着我们的“技术栈”将无法胜出,而真正重要的是这个带有神秘色彩的“栈”——实际上不过是芯片本身的代称。

即便人工智能将无限期地停留在“普通技术”和“仅仅是工具”的层面,我们所面对的也只是平凡无奇的 AI,在至少 NVIDIA 能够满足市场全部需求之前,这样做仍然是错误的。每一块被制造出来并卖给中国的芯片,就意味着少了一块被制造出来并卖给美国的芯片。即便在那之后,在这些正常世界里,算力获取仍将是经济生产力、技术进步以及国家安全的关键。

如果你明白超级智能很可能即将到来,而且一切都将发生改变,并且很可能会在相对不久的将来实现,那么这种局面就会令人难以承受。

尤其糟糕的是,Jensen 对网络安全和 Mythos 问题的回答:我们需要与中国人展开对话,并让他们同意不将 AI 用于不良目的,显然其中也包括网络攻击。

我非常支持就人工智能与中国展开对话,并就哪些事情不应去做达成一致,但在当前情况下,这显然且无可救药地既天真,又在现实层面不可行。中国人一向有着在同意不做某些事后仍然去做的漫长历史,因此,一旦我们允许他们具备这样做的能力,核实的方法又是什么?

你们会要求他们对所有 API 调用实施严格限制和监控吗?因为即便可以相信他们有意停止这么做,这也只是最起码的要求。事实上,一开始就不去发展这些能力要容易得多,但无论哪种方式,你都需要先打下基础,而这需要时间,而我们并没有做到这一点。

因此,是的,这里存在着一道巨大的分歧:Jensen 对 AGI 和超级智能的理念确实仍未真正接受,也并不理解他的公司正在促成降临于世的那个东西。

但同时,即便 Jensen 在这一点上是对的,鉴于我们已经知道哪些事情是可能发生的,他在其他方面仍然是错的。我们早已过了这样一个阶段:把“AI 视为一种再正常不过的技术,因此你就应该把芯片卖给中国”当作一种站得住脚的论点。我们知道这并不属实。

黄仁勋只想要一件事 ,这并不令人反感,但我还想要别的东西。

关于 Dwarkesh Patel 对 NVIDIA 首席执行官 Jensen Huang 的播客访谈

我会在本文末尾、在我们掌握充分背景之后,再谈对此的反应。

NVIDIA 的护城河是什么?

  1. NVIDIA 为 TSMC 和其他公司制造硬件提供所需的软件,但为什么这些软件不会像其他软件一样走向商品化?Jensen 经常被问到这个问题,他的回答显然是一套经过充分打磨的说辞。他给出了三个真正的答案:需求会不断不断上升,软件公司总体上会因工具的使用而繁荣,而 NVIDIA 所面对的具体任务极其困难。

    1. 需求肯定会增长。这一点并无争议。

    2. 软件公司只有在能够持续提供独特且优于竞争对手的产品,尤其是在关键价值上胜过新进入者和自制方案时,才会因工具的使用而繁荣。事情会朝哪个方向发展并不明显,而他也没有提出论证。

    3. NVIDIA 面临的任务确实极其艰巨。利用有限的 TSMC 产能制造出性能仅略有提升的芯片,这种能力只会变得越来越有价值,即便竞争对手也能做得相当不错。但这并不能说明,在光辉灿烂的 AI 未来里,竞争者就无法设计出同样优秀的芯片。

    4. 我仍然乐于看多 NVIDIA(这不是投资建议!),但这还不足以向我们展示其真正的护城河。

  2. NVIDIA 目前有约 1000 亿美元的购买承诺,很快将达到 2500 亿美元,从而锁定稀缺组件。这是否就是 NVIDIA 的护城河?Jensen 表示,他们会作出大规模承诺,包括通过展示未来市场规模,促使其他公司进行大额投资,而这正是他投入大量时间在做的事情。他们拥有供应链、现金流量,以及持续运转能力。

    1. 我认可,这些都是非常好的投资,能带来很大帮助,而新的竞争者将在其中的多个环节举步维艰。

    2. 如果面临真正严肃的竞争,我不认为这会在长期内构成可持续的护城河,但在中期内,这是一项巨大的优势。

  3. NVIDIA 能否年复一年持续将营收翻倍、将算力提升至三倍,还是说我们正在撞上诸如 TSMC 那样的产能墙?Jensen 指出,任何环节都可能成为瓶颈,实际上最难的是电工和水管工,但他们正在疯狂扩张所有环节,所有瓶颈都会得到重视。只要有需求信号,任何特定瓶颈都可以在两到三年内扩容解决。

  4. 他想“让美国再工业化”。他需要能源,但其他问题都只是两到三年的问题。

  5. “这是我对那些末日论者宣扬工作终结、岗位消失的一大担忧。如果我们劝阻人们不要去做软件工程师,我们就会耗尽软件工程师。十年前也出现过同样的预测。一些末日论者当时告诉人们,‘无论如何,都不要去当放射科医生。’你现在可能还能在网上看到一些那样的视频,说放射科将成为第一个消失的职业,世界将不再需要更多放射科医生。结果呢?我们现在短缺的正是放射科医生。”

    1. 这显然是在把“doomer”当作一种蔑称使用,借助联想和氛围感,来轻率否定任何对 AI 负面影响的担忧。

    2. 这其中也有一些合理观点,但整体逻辑混乱。我们必须拆开来分析。

    3. “他们抢走了我们的工作”式的担忧有两种,而这里把二者混为一谈了。

    4. 第一种,是关于整体意义上的“工作终结”以及就业岗位被普遍消灭,也就是对大规模失业和工资下滑的担忧。他一开始说自己是在回应这种担忧,但随后就转了话题,实际上并没有真正谈到这一点。正如我之前所说,我认为有些人对此担心得过头了,但一旦能力发展到足够强,这就会成为一个重大隐忧。

    5. 他主要谈论的是这样一种预测:某些特定职业将因局部性的技术性失业而受到冲击。

    6. 显然,如今在人工智能领域,确实已有一些这样的案例。十年前,如果你劝别人去当翻译,那就是坑了人家。

    7. 放射科医生是一个很有意思、也经常被讨论的案例。就这一点而言,发出警告的人是对的:人工智能在图像分析方面会达到超越人类的水平。

    8. 但这反而带动了对放射科服务需求的增加,而且人工智能无法取代这项工作中的许多其他环节;同时,由于从更长期来看,放射科将越来越自动化,而医生的职业生涯往往长达40年,许多人因此不再选择进入放射科。

    9. 因此,就目前而言,在2026年,我们面临放射科医生短缺,而放射科医生的收入也很高。然而,从更长远来看,随着放射科医生需求占医生总体需求的比重似乎可能下降,对放射科医生的需求也可能随之减弱。标准经济学理论认为,这意味着我们当前本就应该出现放射科医生短缺。

    10. 因此,目前尚不清楚这种短缺本身是否低效。但如果它的确如此,而且我们集体犯了错,那么错误在于,我们对这一特定职业作出了一个错误的预测,而这一职业的人才培养存在长达数年的滞后。

    11. 再说到软件工程师,这里我们对这两类错误都不必过于担心,因为尤其在当下有了智能体编程,程序员的供给是有弹性的。你可以相对很快地启动起来。我的判断是,未来一段时间我们会需要更多工程师,而不是更少。

    12. 这不该是“末日派”或“减速派”对“乐观派”或“加速派”的争论。这是一个资源配置问题,你必须着眼未来,尽你所能做到最好;而谁对大局判断正确,并不会对谁在具体选择上判断正确产生那么大的影响。

TPU 对阵 GPU

  1. Claude 和 Gemini 都是用 TPU 训练出来的。这意味着什么?又到了再来一段演讲的时候。Jensen 将 TPU 描述为一种狭窄的产品,而 GPU 则能加速各种类型的计算,因此市场覆盖面要广得多。你既可以自己部署,也可以租用,还能完成 TPU 做不到的事情。

    1. 这就引出了一个问题:为什么算力的可替代性没有更强?Jensen 提到的 xAI 拥有规模庞大的 GPU 集群,但似乎没有人想使用他们的推理服务,那么他们为什么不把这部分产能租出去?又或者,他们其实已经在这么做了?

    2. 我承认,GPU 的确有很多 TPU 无法涉足的应用。毕竟,我总不会用 TPU 来驱动我的显示器。

    3. 但如果未来人们需要算力的主导原因是 AI,而在这方面 TPU 与 GPU 又可以相互替代,那么 TPU 最终难道不会在很大一部分市场中具备竞争力吗?

    4. Jensen 的论点并未回应这一点,而这恰恰是其中隐含的核心问题,因此 Dwarkesh 进一步把问题挑明了。

  2. Dwarkesh 指出,NVIDIA 每季度 600 亿美元的利润主要来自 AI,而不是量子计算和制药。既然如此,为什么还需要 GPU 的灵活性?Jensen 表示,当然,矩阵乘法是一方面,但你也可能希望采用其他技术路径。他还夸耀称,Blackwell 相比 Hopper 实现了 50 倍的能效提升。MoE 就是这样的创新之一。

    1. 黄仁勋的意思是,在每单位算力上效率提高了50倍,或者说在完成同样的软件任务时效率提高了50倍,而不是指芯片与芯片之间的直接对比。电力仍然是一个限制因素。

    2. MoE 由 Google 在 TPU 上发明,因此 TPU 显然可以运行 MoE,尽管如果你不是 Google 或 Anthropic,你可能还是需要 CUDA。

    3. 如果 Google 愿意将其内部 TPU 内核库开源,它本可以缩小这一实际差距中的大部分,甚至全部;但他们并不想这么做,而是更愿意利用 TPU 在 AI 领域取胜,而不是出售芯片。

    4. Google 这么做是对的吗?还不明确,但向 Anthropic 大量出售芯片是一条奇怪的中间路线,这很可能反映出 Google Cloud 与 DeepMind 之间的内斗。

    5. 关键在于,NVIDIA 在 AI 芯片领域对 Google 的护城河……主要恰恰是 Google?

  3. NVIDIA 60%的营收来自五大超大规模云服务商。他们真的需要 CUDA 吗?OpenAI 有 Triton,Anthropic 和 Google 都在运行自研加速器。Jensen 给出的说法,一方面是“乐于支持所有框架”,另一方面则是“CUDA 极其灵活,拥有庞大的装机基础,且覆盖每一家云服务提供商”这套论点。

    1. 好吧,确实,没什么令人意外的,但很扎实。

  4. 不过,这些优势对那些重要客户而言,是否真的重要到足以支撑 70%以上的利润率?NVIDIA 拥有大量工程师为各家的技术栈进行优化,而且我们谈论的是两倍甚至更高的性能提升。他还嘲讽 TPU 和 Trianium 未通过 InferenceMAX 进行测评,并声称所谓 TPU 领先 40%的说法根本站不住脚,很可能是假的。

    1. NVIDIA 确实拥有真正的优势,但 Jensen 在这里多少有些夸大其词了。

  5. Jensen 表示,所有这些“竞争”其实都指向 Anthropic:“Anthropic 是一个特殊案例,不是一种潮流。没有 Anthropic,TPU 为什么还会有任何增长?100%就是 Anthropic。没有 Anthropic,Trainium 为什么还会有任何增长?100%就是 Anthropic。我认为这一点相当广为人知,也广受理解。并不是说 ASIC 机会遍地都是。只有一个 Anthropic。”而 OpenAI 或许正在打造 Titan,但他们“绝大多数还是依赖 NVIDIA”。

    1. 这一说法的核心基本上是:“Anthropic 是那个奇怪的异常,其他 AI 公司根本不会这么做,这也是那些芯片之所以能有实质性销量的唯一原因。”

    2. Anthropic 证明了这套模式在技术上行得通,但如果它需要长期投资、足够规模,甚至从第一天起就得对 TPU 有很深的熟悉度才说得通,那么也许吧?

  6. 黄仁勋基本上将 Anthropic 采用 TPU 归咎于自己当时未能尽早投资 Anthropic,而 Google 和 AWS 则进行了投资。他不会再犯同样的错误。

    1. 我认为,这与其说是“Amazon 和 Google 通过利益输送换取了 Anthropic 的业务”,不如说主要是“Nvidia 未能向 Anthropic 提供足够的利益输送”。

  7. Dwarkesh 指出,在 70% 的利润率下,即便你比 Nvidia 差得多,只要自研芯片,最终仍可能更划算。黄仁勋则反驳称,Broadcom 等公司的 ASIC 利润率其实也差不多,约为 65%。

为什么 Nvidia 没有进行超大规模扩张?

  1. 黄仁勋表示,NVIDIA 一有能力就尽快扩大规模,也一有条件就尽早投资这些实验室。当时资金并不充裕,他认为这些实验室会从风投那里融资。尽管 Anthropic 从 Google 和 Amazon 获得了融资,但他仍乐见 Anthropic 的存在。

    1. 这就是交易员的哀叹:如果那是一笔好交易,你本该做得更多,而且本该更早出手。

  2. 但现在手握这么多钱,又该怎么办?为什么不去做云服务提供商?因为那不是 Nvidia 的业务,也不是它的理念。别人能做的事,就让别人去做。

    1. 人们低估了保持专注的重要性。

    2. 我完全相信,如果你不认为超级智能会让除 AI 实验室之外的所有人都变得无能为力,那么 Nvidia 在这件事上的判断就是正确的。投资所有模型公司,尽可能锁定更多业务,不管最后是谁胜出都能赢,不要试图自己去做模型公司,也不要去做云服务提供商。

    3. 如果你确实认为只有 AI 实验室才重要,像 Musk 那样,那就大错特错了。好吧。

  3. NVIDIA 为什么不“挑选赢家”?那不是他们的工作。让他们自己去拼个高下。

    1. 我还要补充一点,竞争对 NVIDIA 是有帮助的。

    2. 当然,从另一层意义上说,NVIDIA 也在“挑选赢家”——通过决定投资规模、决定估值、决定资源分配,只不过它会尽量以一种让竞争持续流动的方式来这样做。

    3. 如果 NVIDIA 真的不想决定谁会胜出,它就会完全通过价格来分配。

  4. NVIDIA“不想涉足融资业务”,但当然,当 OpenAI 需要时,他们会提供 300 亿美元的帮助——这是一笔很好的投资。他们并不只是“想扶持新云公司”、超大规模云服务商或实验室。

    1. 他们就是在做融资业务。这就是融资业务。

    2. 话虽如此,我并不认为 NVIDIA 这么做是为了扶持那些原本就没有前景的业务,或是在进行糟糕的投资。我认为,NVIDIA 是在借此锁定商业交易,同时进行本身就不错的投资。三赢。

    3. 他们处于融资业务的那一端,在那里,你首先必须证明自己并不需要融资。这几乎就是大多数融资业务的运作方式。

  5. 双方都认同:GPU 存在短缺。

    1. 这一点稍后会变得重要。

  6. NVIDIA 如何分配稀缺的 GPU 配额?首先,顾客必须提交购买订单。然后按先来后到的原则处理。Larry 和 Elon(在无人提及的情况下被主动说起)从未为 GPU 苦苦求情。一切都只是下订单而已。

    1. 我没有任何内部消息,但这听起来完全就是胡扯。

    2. 很长一段时间里,GPU 的短缺程度极其严重,在 NVIDIA 的定价水平上,需求规模是供给的数倍。配额事关生死。

    3. 如果你真的毫不在意,你就会提高价格。

    4. 如果完全是先到先得,那么分配模式看起来就会非常不同。

    5. 即便 Jensen 不打算听,Elon Musk 当然也会像其他所有人一样,尽其所能试着钻制度的空子,只不过做得更狠一些。也许他并没有严格意义上的“哀求”,但这无疑是那种典型的“过于具体因而可疑的否认”。

    6. 这与他讲述的关于 Anthropic 的说法并不一致。

  7. 为什么不价高者得?“因为那是糟糕的商业做法。你定下你的价格,然后由别人决定买还是不买。我知道芯片行业里有些公司会在需求更高时调整价格,但我们不会。我们从来没有这么做过。你可以信赖我们。我更愿意成为可靠的存在,成为整个行业的基础。你不需要反复猜测。如果我给你报了一个价格,那就是这个价格。仅此而已。即便需求暴增,那也照旧。”

    1. 每一位经济学家此刻都在大喊。

    2. 如果你不能被指望按时交付产品,你就不可靠。

    3. 如果你完全按照先入先出、并以固定且过低的价格供货,你往往就无法交付。

    4. 是的,我同意,如果我给你报了一个价格,那么即便需求上升,这个价格也应当不变。但多年来,Nvidia 的定价一直低于市场出清水平。

  8. 他们与 TSMC 关系非常好。双方会争执,有时还会有些“粗放式的公道”,但你可以相信,TSMC 每年都会在那里,而 NVIDIA 每年也都会推出一款新产品。双方都可以按照你的需求扩大或缩小规模,你只需要下订单。

    1. 即便事实并非如此,他还是会这么说。

    2. 这是一种很奇怪的局面:双方彼此需要,又必须分配利润,存在着巨大的 ZOPA 空间,但没错,归根结底他们还是能把事情做成。

    3. 那一大堆钱?确实有帮助。

    4. 考虑到这种爆炸式增长,大多数时候出现一定程度的短缺是合乎情理的。这和 Anthropic 犯的是同样的“错误”。

向中国出售芯片

到目前为止,他们花了一个小时向 Jensen 提出一些常规商业问题,而他给出的也大多是标准的商业回答。没有人在谈论那一个小时。

接下来这一部分,就是网上人人都在谈论的话题:出口管制。

  1. Dwarkesh 把自己定位为“唱反调的人”。他将站在反对出口的一方。

  2. 那 Mythos 呢?如果中国企业能够训练出类似 Mythos 这样的模型,尤其是率先做到这一点,难道不会威胁美国国家安全吗?

    1. 我想我们都能同意,这将是一个非常可怕的情景,这是一个具体例子,说明我们不希望中国拥有能力最强的模型。

    2. 出口管制还适用于其他类型的情况。

  3. 黄仁勋一开始就说,Mythos 是由一家非同寻常的公司用“相当普通规模的、相当普通的算力”训练出来的。中国拥有这样的能力。他“希望美国获胜”,但别把他们变成你的敌人,他们太有实力了,你明白的。“他们制造了全球 60%的主流芯片,甚至可能更多……他们拥有全球 50%的 AI 研究人员。”

    1. Dwarkesh 在这里对这一点以及接下来几项内容做了精炼概述 

    2. 好吧,说真的,这在实质上完全就是一派胡言。

    3. 没错,严格来说这里的数据可能大体属实,但他想表达的是“中国已经拥有所需的全部芯片”,这是错误的;还想说他们的人才储备和我们一样雄厚,这同样是错误的(以研究人员数量衡量人才和能力是非常愚蠢的标准);并且“因此我们无法击败中国,只能达成一笔交易”。

    4. 他并不希望美国获胜。至少,他并不太在乎。事实上,他还错误地宣称我们做不到。

  4. 他希望通过“研究对话”达成一项关于不将人工智能用于哪些用途的协议。

    1. 我确实希望就人工智能安全问题与中国展开对话。我强烈认同,让我们的研究人员和人工智能领域人士进行交流会是件好事。

    2. 同意搁置人工智能的一些用途是件好事。“不让人工智能掌控核武器”的第一步,显然是好事。

    3. 将这一原则扩展到网络攻击同样是好事,但从某种意义上说,我们难道不是本来就已有不发动网络攻击的协议吗?

    4. 而从某种意义上说,中国难道不是一直都在公然无视这项规则吗?

    5. 那么,如果中国具备利用人工智能发动网络攻击的能力,我们为什么会指望中国遵守这样的协议?你们会进行真正的核实吗?

    6. 达成一项“不将 AI 用于[X]”的协议,要比一开始就确保 AI 根本无法做到[X]困难得多。与其达成狭窄、具体的协议,达成一项广泛、笼统的共识实际上往往更容易。

  5. Jensen 谈到,开源和初创企业生态系统对网络安全至关重要,“这个生态系统需要开放模型”来开展相关工作,而且大量网络安全工作正来自中国。他表示:“认为你可以让一个 AI 代理四处运行,却完全没有人盯着,这种想法本身就有些疯狂。”

    1. 确实有一些 AI 代理在四处运行,却没有任何人监管。

    2. 而且这样的 AI 代理还会多得多。接受现实吧。

    3. 这太疯狂了吗?不。但这正在发生。

    4. 至于其他那些说法,大多是风马牛不相及,也并非网络安全的未来,而且他显然也没能平息这些传言。

  6. Dwarkesh 提出反驳。中国的芯片充其量也就是 7 纳米。它们的浮点运算能力只有我们的 10%。Anthropic 率先做到这一点,并得以推出 Glasswing,这一点相当重要。一旦这样的模型问世,算力规模就会变得极其关键。无论在美国还是中国,所有实验室都受制于算力瓶颈。

    1. 他在所有这些问题上的判断看起来完全正确。

  7. 黄仁勋回应称,没错,我们应当始终领先,并始终拥有“更多”的算力,但中国拥有“巨量”的算力,是全球第二大市场,而且他们可以将这些算力整合起来。

    1. 这里所谓的“巨量”是相对而言的。

    2. 理论上他们可以整合起来,但出于显而易见的原因,他们不会这么做;而且如果他们真这么做了,只会让整件事显得更加可怕。

    3. Jensen 一边不断地说“我们在算力上有优势”,一边又说“但他们的算力已经够了”,同时还在说——无论是在采访后半段,还是他平时一直反复强调的——“我们应该把其中很大一部分优势让出去,来换取我赚更多钱。”

  8. Jensen 转而谈到能源。中国拥有充足的能源。“他们为什么不能把 4 倍、10 倍数量的芯片堆在一起?因为能源几乎是免费的。他们有数据中心,电力供应完备,却空在那里。认为中国拿不到 AI 芯片,这完全是无稽之谈。他们制造芯片的能力是全球最大的之一。半导体行业都知道,他们在主流芯片上处于垄断地位。他们产能过剩,他们的产能太多了。所以,认为中国不可能拥有 AI 芯片,完全是胡说八道。”

    1. 坦率地说,这对 Jensen 来说相当难堪。

    2. 他试图辩称,中国人并不需要他的产品,甚至根本不该想要他的产品,他们已经拥有所需的全部芯片,性能较差的芯片也完全可以胜任同样的工作,而且中国的芯片产能已经过剩。

    3. 这根本就是彻头彻尾的错误,显而易见,完全不符合事实。

    4. 我尽量不轻易说这种话,但没错,这就是显而易见的胡说八道。

    5. 我们之所以知道这一点,是因为我们看到,中国在 AI 领域试图推进的所有事情,都面临着巨大的、切实存在的算力瓶颈。

    6. 我们之所以知道这一点,是因为在实施管制之前,中国拥有的算力与我们大致相当,而现在他们的算力只有我们的10%。

    7. 如果中国真能做到这一切,也确实拥有所需的全部 SCIP 之类的东西,那么那些已经接通全部电力的数据中心,为什么还空着?为什么谁都没有足够的算力?那些配备了他们根本都用不完的额外芯片的海外 Huawei 数据中心在哪里?Sacks 曾告诉我们,如果我们不达成正确的交易,这些数据中心就会出现。得了吧。

  9. Jensen 接着开始吹捧 Huawei。这是他们历史上最好的一年。他们出货了大量芯片,数以百万计的芯片。比 Anthropic 拥有的芯片多得多。他们有充足的逻辑芯片,也有足够的 HBM2 内存。最先进的 HBM 并不需要 EUV,反正他们本来就是一家网络公司。归根结底,真正重要的还是算法改进。

    1. Jensen 显然已经乱了阵脚。读起来就是一种上头、愤怒、绝望,以及对一个毫无道理的说法变本加厉地加码。就是把各种词往墙上扔,看哪个能粘住,一味否认、否认、再否认。

    2. 如果把这段和他吹捧 NVIDIA 时的说法穿插剪在一起,应该会很有意思。

  10. 我们理解这种“技术栈”的论点。“DeepSeek 并非无足轻重的进展。DeepSeek 若率先在 Huawei 上发布,对我们国家来说将是一个可怕的结果。”Dwarkesh 直截了当地问,为什么?Jensen 说,假设它是“为 Huawei 优化的”,那我们的硬件就会处于劣势。

    1. 说到这里,我都不知道该说什么了。我们为什么要在乎那个特定模型在哪种硬件上运行时效率稍高一点?这根本没有区别。这很愚蠢。NVIDIA 正把它能生产的每一块芯片都卖出去,而且未来很长一段时间都会如此,Jensen 对此也并不否认。

    2. Jensen 实际上是在直说,糟糕的结果将是 NVIDIA 在某一特定竞争中处于劣势。这某种程度上已经把底牌亮出来了,而他接下来还会亮得更多。

    3. 哦,此外,Jensen 对 DeepSeek 的这份执念仍在持续,他再次将其视为一项“重要进展”。这是策略性的。DeepSeek 确实是一家不错的实验室,尤其考虑到其硬件受限极为严重,但他们最大的成功在于学会了在算力极度匮乏的情况下依然取得惊人的进展;而且,他们很可能已有一段时间不再拥有中国最好的模型了。正如我反复解释过的那样,“DeepSeek 时刻”被严重夸大了。

  11. “你描述的是一种在我看来算得上好消息的局面。一家公司开发了软件,开发了一个 AI 模型,而且它在美国技术栈上运行效果最好。我认为这是个好消息。你把它当作一个坏消息的前提来设定。那我来告诉你什么才是坏消息:世界各地开发的 AI 模型,运行效果最好的是非美国硬件。那对我们来说才是坏消息。”

    1. 一锤定音。证毕。我的论证到此为止。摘下面具。谢谢您,先生。

    2. 也就是说,他认为,如果中国人开发出最好的模型,只要它在他的硬件上运行得最好,那就是好消息。那就是赢。

    3. 相反,如果中国人开发出的模型不是最好的,但它在华为芯片上的运行效果优于在 NVIDIA 芯片上的表现,那就是坏消息。那就是输。

    4. 他在乎的只有 NVIDIA 硬件的销售。别再假装不是这么回事了。

  12. Dwarkesh 问道,模型难道不能直接更换加速器吗?Jensen 回答说不能,并表示“我本人就是证据”。NVIDIA 的成功就是最有力的证明。Dwarkesh 指出,人们反正还是会这么做,Jensen 则称那样运行效果并不会更好。Anthropic 的模型运行在 Trinium 和 TPU 上,但“这种转换需要投入大量工作”。

    1. “证据就是我本人。”

    2. 这就是他贯穿始终的态度。权威已经发话了,平民。

    3. 是的,当然,如果只是直接替换,它们的运行效果不会更好。NVIDIA 的芯片更强,没错,优化也确实有一定价值。但关键在于,在大多数情况下,效率损失是适度的,所以你会用手头现有的东西。

    4. 黄仁勋并未回应这样一个事实:Anthropic 正在三种截然不同的硬件架构上运行同样的模型,而且一切运转良好。你只需要把这项工作做好。

    5. 这项工作会变得更容易,因为人工智能可以来完成这项工作。

  13. “但看看全球南方,再看看中东。开箱即用的情况下,如果所有 AI 模型在别人的技术栈上运行得最好,那你现在就不得不提出某种荒谬的论点,说这对美国是件好事。”

    1. 好吧,这已经是在无脑抬杠了。根本没人这么说,而且从好几个层面看都不是。你急了?

    2. 我们来拆解一下。

    3. 这里所说的“所有 AI 模型”是从哪儿来的?我们讨论的是,部分 AI 模型可能会针对非美国硬件进行优化。最重要的模型,很可能也是最好的模型,并不属于这一类。

    4. 这里所说的“技术栈”已经不再包含 AI 模型了。而“技术栈”的意义恰恰在于它同时涵盖硬件和模型,所以这甚至都算不上一个真正的技术栈。

    5. “在非美国硬件上每单位算力使用效率最高运行”和“在非美国硬件上运行效果最好”之间有着巨大差别。NVIDIA 的硬件优于非美国硬件。因此,即便在切换过程中存在一定程度的效率损失,你依然会从这种显著的性能差距中受益。

    6. 他承认,这只是在“不做额外工作”的“开箱即用”情况下才成立;但未来显然会有其他人去完成这些工作,而你将能够在你的 AI 的帮助下,受益于他们已经完成的工作——前提是这些工作确实有价值。

    7. Jensen 刚刚还在论证:不,芯片性能有多好并不重要,你完全可以把更多芯片串联起来,一切照样没问题。

    8. 有点好笑的是,这段针对 Nvidia CEO 的回应,主要是在由我来吹捧 Nvidia 芯片,而他自己却在贬低它们。

  14. “你为什么会认为这完全可以互相替代——如果你不向他们提供算力,就会被 Huawei 原封不动地替代?他们落后了,不是吗?他们的芯片比你的更差。” “这完全……眼下就有证据。他们的芯片产业规模极其庞大。”

    1. 我不知道还能怎么说,除非直说:Jensen 往好了说也是在胡扯。

    2. 他的意思是,无论 Nvidia 是否向中国出售算力,都不会影响中国拥有多少算力。即便只是如此有限的一项主张,他也是这么辩解的。

    3. 我们究竟要到什么时候,才肯承认这个人到底是谁、又是什么样的人?

    4. 这样来来回回讲了一阵子,却没有提出任何新内容,直到我们又迎来一个值得注意的时刻。

  15. “听着,你为什么要让 AI 产业中的一个层级失去整个市场,只为了让另一个层级受益?这个产业有五个层级,而每一个层级都必须成功。实际上,最需要成功的那一层是 AI 应用。你为什么如此执着于那个 AI 模型?那一家公司?究竟是为了什么?”

    1. 有问题吗?

    2. 从策略层面看,Dwarkesh 或许也负有部分责任,因为他当时还没有进一步强调:一个国家之所以可能希望获得更多算力,尤其是那些价格远低于公平市场价格的算力,除了直接训练成本之外,其实还有其他理由。

    3. Dwarkesh 依然是当下最出色的采访者,在努力打一手极其艰难的牌。受访者态度敌对、不配合,也不可靠,而他所做的很大一部分工作,实际上就是设法争取到两个小时与受访者交谈,甚至能当面与他争辩,同时还不至于让 Jensen 愤然离场。这是一项艰难的工作,就像观看或阅读这场访谈同样不轻松。

    4. 因此,即便是在超级智能和决定性战略优势并不存在的世界里,他也没有理解,AI 的经济影响归根结底取决于:谁在为什么目的使用何种推理,以及使用的规模有多大。NVIDIA 是全球市值最高的公司,但即使是在“AI 只是常规技术”的世界里,相对于应用层和模型层而言,他所能分到的利润份额终究只是微不足道的一点。应用之所以能够成功,是因为你拥有开发、部署和运行这些应用所需的模型与算力。

    5. 显而易见,再说一遍,即便是在“正常技术”世界里,向中国出售 NVIDIA 芯片也无益于“美国技术栈”,也帮不到这块所谓蛋糕的其他层。它们将运行在中国的能源之上,驱动中国模型,服务中国应用。然后,如果这真的是一个正常技术世界,中国芯片——很可能是在 NVIDIA 芯片辅助下由 AI 设计出来的——一旦追赶上来,最终就会取代美国芯片。

    6. 所谓“就一家公司”的说法很奇怪,仿佛这纯粹只是关乎 Anthropic。显然并非如此,而且 Anthropic 大多数时候甚至都不用 NVIDIA 芯片。Mythos 恰好只是能力跃升的一个例子而已。显而易见,同样的逻辑既适用于一边的 OpenAI、Google 和 xAI,也适用于另一边的中国公司。

  16. Dwarkesh 再次试图谈论 NVIDIA 芯片究竟领先多少,以及中国还在艰难推进 7 纳米制程时,NVIDIA 已经迈向 3 纳米,接着是 2 纳米,甚至 1.6 纳米。他还指出,“中国拥有无限能源”这一说法意味着,你每向中国出售一块芯片,中国就相应多获得一分算力,因为不存在其他限制因素。

    1. 谈得不错,也是一次很好的尝试。

  17. “听着,我只是觉得你说话太绝对了。我认为美国应该领先。美国拥有的算力是世界其他任何地方的 100 倍。美国应该领先。好吧。美国就是领先的。”……“为什么我们不出台一种更平衡的监管,让 NVIDIA 能够在全球取胜,而不是把全球市场拱手让人?你为什么会希望美国把全球市场让出去?”他的意思是,只要只有美国能拿到 Vera Rubin,这难道还不够好吗?

    1. 在这种语境下突然抛出100倍这样的说法,实在太离谱了。

    2. 如果你仔细想想,就算是 10 倍,也足以把 Jensen 先前关于中国不需要更多算力的论点彻底碾碎。

    3. 归根结底,他在乎的还是自己的市场份额,并把这称作“把全球市场让出去”。

    4. 这也意味着,竞争的对象是一组规模既定的市场,而不是在芯片供应固定、谁都不够用的情况下展开争夺。

    5. 那么,一个显而易见的折中方案如何:如果 NVIDIA 能够生产足够多的芯片来满足西方需求,那么我们再讨论出售剩余部分?不,他也强烈反对这种做法。

  18. 黄仁勋把任何将人工智能与核武器或导弹弹壳相提并论的说法称为“荒谬”。他称把算力比作铀是一个“糟糕”且“不合逻辑”的类比。对此并未提出任何论证。当被问及零日漏洞利用问题时,他表示,解决办法是通过“对话,确保人们不会以那种方式使用技术”。

    1. 到了这一步,他已经开始赤裸裸地进行人身攻击了。

    2. 谈到网络安全问题,我重申上面的逻辑,只想强调这个回答显而易见地有多么幼稚。中国会将其模型开源。即便你能让中国同意不发动网络攻击,即便你能让中国政府自己不去实施这些攻击,即便你能让他们试图在中国境内执行这一点,那又怎样?你打算如何执行?即便你 somehow 能在中国境内执行,等到朝鲜人根本不在乎的时候又怎么办——而他们显然根本不在乎。

    3. 再说一遍,除非能够实施[X]的行为主体数量极其有限——例如涉及现有核武器的情形——否则人们不可能仅靠“同意不将 AI 用于[X]”来解决问题。你必须从一开始就不允许这种能力存在,或者至少必须在全球范围内,对这种能力的相关来源进行广泛监控。先生,请务必严肃对待此事。

  19. 随后,他又回到那句话:“拱手让出整个市场,并不能让美国在芯片层、在计算栈中,长期赢得技术竞赛。”

    1. Dwarkesh 显然并不是在主张,不向中国出售芯片有利于我们长期在芯片层面、尤其是在这一层面赢得竞争。

    2. Jensen 之所以反复强调这一点,是因为这是他唯一在乎的事情。

    3. 既然 Dwarkesh 在这里没有提出这个论点,那我想就该由我来提出了。那么我们就分两部分来谈。

    4. 首先,NVIDIA 如今已经能卖出其生产的每一块芯片,而 Huawei 同样也能卖出其生产的每一块芯片。如果你在中国卖出一块 NVIDIA 芯片,所发生的一切不过是把这块芯片在物理上转移到中国。若这种情况持续足够长时间、发生得足够频繁,并且规模扩张得足够快,那么,是的,局面会改变,但眼下并不是这种情况。

    5. 因此,向中国出售芯片是否会从根本上改变中期或长期的芯片格局,完全谈不上显而易见;而且几乎可以肯定的是,这也不会影响任何人短期内的芯片销售。除非 NVIDIA 有意生产只面向中国市场的芯片,而不是为美国生产芯片。

    6. 中国高度重视芯片自主自足。就我个人而言,我会相对更看重其他一些事情,但中国对此高度关切是完全合理的,而且他们绝不会放手不管。中国也已经展现出,为实现这一目标而限制 NVIDIA 在中国境内销售的意愿。因此,我们应当得出结论:如果未来 NVIDIA 在中国的销售威胁到 Huawei 制造和销售更多芯片的能力,中国将出手干预,以有利于 Huawei。只要 NVIDIA 的销售在这方面会产生影响,这些销售就会被叫停。即便在这种背景下,能够达成的销售,也只是一些本不该发生的误判性销售。

    7. 从长远来看,制约一切的关键因素是智能与算力,以及解决各种问题并创造更优设计的能力。再说一遍,即便是在像 Jensen 这样的怀疑者所预期的那种“AI 只是常规技术”的世界里,这一点也同样成立。如果你向中国出售大量芯片,而他们拥有更好的 AI 模型和更多用于运行这些模型的算力,那么他们随后就会更频繁地利用这些更好的模型,去创造更先进的芯片和 EUV 设计,就像他们推动其他一切进步的方式一样。

    8. 与此同时,这些销售直接以牺牲我们自身利益为代价,为中国经济注入强劲动力,这也削弱了我们做所有事情的能力,反而增强了他们的能力。

    9. 所以,不,这甚至在其表层意义上也不只是“一个事实”。高度可能的是,从长远来看,限制 AI 芯片供应有助于你在 AI 芯片市场上的竞争地位。

  20. 在狭义的芯片问题上,Dwarkesh 也提出了看法,指出 Tesla 和 iPhone 并未在中国形成锁定效应。Jensen 则进一步强调:“真正重要的是我们生态系统的丰富性。”

    1. 还可以援引大量技术转移、逆向工程等案例,作为反对让他们获得这些芯片的理由。

    2. 这里的“我们”指的是 Nvidia 和 CUDA。他并不在乎模型、应用或经济活动是否属于中国,因为那并不属于“我们”。

  21. 他似乎对把 NVIDIA 比作汽车感到大受冒犯,NVIDIA 不是汽车,你不可能“今天买这个汽车品牌,明天又用另一个汽车品牌,这很简单”。

    1. 嗯,实际上,可以,而且人们确实会这么做。虽说不可能在毫无损耗、也毫无预先通知的情况下完成切换,但没错,人们一直都在这么做。

  22. 猛料还在继续:“基于你所描述前提而让出一个市场,我根本无法认同。这毫无道理。因为我不认为美国是失败者。我们的产业不是失败者。那种失败主义主张,那种失败主义心态,在我看来毫无道理。” “你不用继续往下说了。我倒是很享受这个话题。”

    1. “我根本不能承认这一点。” 不,你不能。

    2. “不是失败者。” “那种失败者心态。” 很能说明问题。有人被戳到痛处了。

    3. 这个人掌舵着全球市值最高的公司,公司的所有产品都被抢购一空,而他却害怕自己会成为一个“失败者”。

    4. 但他还主动想让这种对话继续下去,哪怕 Dwarkesh 已经意识到,这已经在原地兜圈子,滑向情绪失控。

  23. “我只是想让你承认,对美国科技产业而言,任何边际销售都是有益的。”“按照你的逻辑,这话同样可以用在微处理器和 DRAM 上。你甚至也可以把它用在电力上。”

    1. Jensen 不愿理解这一点。他认为,“美国出售东西”这件事本身,就应被视为对美国或美国科技产业有利。

    2. 而且他声称,这一点显而易见,根本无可辩驳。

    3. 但很明显,这一论点被推得过头了,而且并不具备严密的因果机制。为什么这笔边际销售会给科技行业其他部分带来净收益?

    4. 黄仁勋的论点似乎建立在这样一种前提之上:我们“领先得足够多”,因此回吐其中一部分也无妨;但在另一些时候,他又主张相反的观点。

    5. 是的,如果你没有其他信息,默认认为任何一笔边际销售都是好事,这一假设是正确的。但在这里,我们掌握的信息要多得多。

  24. “我们拥有海量算力。我们拥有大量 AI 研究人员。我们正以最快速度竞速。”

    1. 我们的算力本可以更多。

    2. 如果我们拥有更多算力,并且更愿意从中国及其他国家吸纳人才,我们本可以拥有更多 AI 研究人员。

    3. 因此,我们并没有以我们所能达到的最快速度竞逐。

    4. 需要明确的是:这并不是说我认为我们应该竞逐,或者应该以我们所能达到的最快速度竞逐。

  25. 【后面是更多类似的来回争论,Jensen 继续发表自相矛盾的说法,并继续坚持称其中并无矛盾。】

    1. 甚至还说,美国电信业基本上是被“监管”到退出全球市场的;即便你接受重商主义的论点,用这个词来形容所发生的事情也并不恰当,而且当前情况也并不具有可比性。

    2. 德瓦凯什说:“我试图让你理解出售这些芯片的代价”,而黄仁勋则再次重复他所认为“不出售这些芯片”的代价。换言之,不,先生,我不感兴趣。

  26. 黄仁勋仍然认为,AI“应用层”才是最重要的,而不是模型层。

    1. 但即便如此,这依然是囤积算力的理由。

  27. 黄仁勋不断谈论整个技术栈“失去全球第二大市场”。他似乎一直在宣称:如果中国人使用 CUDA 和 NVIDIA,那么我们的技术栈就在对模型层和应用层——这些最重要的层面——具有实质意义上“赢得了”中国市场。

    1. 我要在这里指出,不,这种说法毫无道理;即便是在“常规技术”的世界里,如果模型和应用是中国的,那么使用的是谁家的芯片其实并没有那么重要。

    2. 除了关乎 NVIDIA 的利润之外,我不明白这件事为什么会这么难理解。

    3. 不过话说回来,这也正是为什么我们会有那句谚语:在这种情况下,要让一个人理解某件事是很难的。

    4. 其实我认为,Jensen 完全明白,只是在假装不明白。

  28. Jensen 提出了一个很有道理的观点:如果我们把美国所有人都吓得开始厌恶 AI,并远离软件工程,那对我们不会有任何好处。他又回到了放射科这个例子,强调工作与任务之间的区别。

    1. 如果让美国人厌恶日常 AI 的使用,并害怕日常 AI(或作为一种常规技术的 AI)对我们生活的影响,以至于美国人拒绝推广它、拒绝利用它来为我们谋利,那确实将是一个巨大的错误。我们应当非常努力地避免这种情况发生。

    2. 如果你看看数据,就会发现,美国人对日常 AI 的反感,与其说是出于对 AI 生存风险的担忧,倒不如说几乎与此毫无关系,甚至也不是出于对像我这样的人所担心的那些灾难性风险的忧虑。

    3. 美国人在被问及时,乃至很多时候在未被问及时,确实会担心这些问题,但这种担忧的重要性并不高。

    4. 普通美国民众最关心的,主要是失业、互联网上充斥着低质内容或深度伪造,以及对环境的影响等等。这令人遗憾,我也试图劝阻这种倾向,但这就是我们的现实。而这与出口管制或人工智能生存性风险的问题几乎没有什么关系。

    5. 是谁在劝人们不要去当软件工程师?我不确定。我认为,主要还是一些试图从经济学角度思考问题的人。

    6. 回到放射科医生这个话题,我还是会引用我之前的分析,同时也要指出,这种短缺很大程度上是由监管俘获造成的,因为我们要求医生,尤其是放射科医生,去做一些表演性质的程序性工作。只要我们愿意,现在其实完全可以培养更多放射科助理执业人员,或者不管你想怎么称呼他们,让他们在依赖 AI 的情况下完成这份工作其余的部分,前提是我们决定将这种做法合法化。也许到了那时,这种短缺反而会加速推动这一进程。

    7. 我认为这些都与 Dwarkesh 提出的实际问题无关,但它们与我们在这里关注的议题有关,而且当 Jensen 提出有力观点时,我也应该点出来,毕竟我一直在猛烈批评他。

  29. Jensen 指出,从 Hopper 到 Blackwell,光刻技术的进步带来的提升或许只有 75%,因此总计 50 倍的性能增益中,大部分都来自 NVIDIA 的架构。

好了,关于大家都在谈论的那个关键部分,到此为止。

不同的芯片架构

  1. 为什么 NVIDIA 不也制造更多采用 N7 工艺或类似工艺的更现代版本芯片?黄仁勋回答说这没有必要,随后又给出了真正的答案:研发成本。

    1. 我认可这一点。对 NVIDIA 这样的公司而言,专注至关重要。把所有工程师都投入到让下一代芯片性能提升十倍上,要更划算。

  2. 那完全不同的芯片架构呢?他们并没有更好的想法;他们模拟过其他方案,结果更差。他是在把 Groq 纳入 CUDA 体系,眼下 token 值得为之付费,而他也希望在 NVIDIA 架构上投入更多。

    1. 这些说法看起来都算公允,唯一奇怪的是,作为 NVIDIA 的掌门人,说“如果我有更多钱”未免有些不寻常?按理说,他似乎应该已经拥有为此所需的全部资金。

  3. 如果没有深度学习,NVIDIA 今天会处于什么位置?加速计算。

  4. 黄仁勋重申,他很享受那次采访。

    1. 我相信。尽管他当时看起来非常沮丧、情绪也有些失控,但像黄仁勋这样的人,又有多少机会能进行一场真正的辩论?又有多少人真的会提出反驳?从某种意义上说,这反而可能是一种解脱。

    2. 下周我要去看 Jensen 领奖,因为我莫名其妙地收到了邀请。

关于出口管制的网络反应

Daniel Eth 和 Connor Williams 属于这样一类人,他们认为 Jensen 反对出口管制的论点完全没有道德可言,纯粹只是为了赚钱,而且根本站不住脚。持这种看法的人还有很多。

Dmitri Alperovitch:对 Jensen 的一次令人难以置信的采访。他公然承认,自己对出口管制发动的“圣战”根本就是为了让 NVIDIA 在全球卖出更多芯片,而不是出于国家安全考虑,也不是为了在与中国的 AI 竞赛中获胜(他此前甚至说过,即便我们赢了,这也无关紧要)

我认为,这样的反应大体上严厉过头了一档。但基本上没错:这些确实是 Jensen 能提出的最有力论据,而它们其实相当薄弱。

Tenobrus:Jensen 在接受 Dwarkesh 采访时,严格说来并非“错了”。他只是不在乎真相。他在乎的是尽可能多地卖出 NVIDIA 芯片,不计后果。很明显,他是在进行有动机推理,为此辩护。我们为什么会期待有什么不同呢?

如果我原本在思想家、传播者、人文主义者和美国人这些维度上对 Jensen 评价很高,这会拉低我对他的看法。但事实并非如此。我对他的高评价在于他是一名商人,而作为商人,他想把芯片卖到中国。

非常感谢 @dwarkesh_sp 在这里如此竭力追问。我希望,Jensen 在这个问题上暴露出的逻辑混乱,能让 NVIDIA 今后更难为自己辩解。

Alec Stapp:这是 Jensen 和 Dwarkesh 就出口管制展开交锋的关键时刻:

1. Dwarkesh 问道,鉴于 Mythos 等 AI 模型涉及国家安全影响,为什么向中国出售 NVIDIA 芯片是可以接受的。

2. Jensen 给出了一个具有误导性的回答,称向中国出售美国芯片是可以接受的,因为中国已经生产了全球 60% 的芯片。

3. 但 Jensen 明知,算力是以 flops 衡量的,而不是以芯片数量衡量。

4. 随后,Dwarkesh 提出反驳,指出若以浮点运算能力计算,中国的算力仅为美国的 10%,而向其提供更多算力将改变其网络作战能力。

这段交锋表明,采访者至少具备一定的技术知识至关重要,这样他们才能对具有误导性的论调提出质疑。

Alex Imas:几个月来,Jensen 一直像是在进行全天候、每周 7 天的采访轮转,而从一开始,最该被提出的头号问题就应该是这段一模一样的交锋。

我不知道这是传统媒体的衰落所致——记者们不再像过去那样以同样“调查式”的风格追问和发问——还是另有原因。但我很高兴有 @dwarkesh_sp 来做研究、揭示真相。

William Buckskin:我喜欢 Jensen,但这恰恰就是我们为什么需要政府。

他会为了他的投资者而为了中国出卖我们。显然,我们不能允许这种事情发生。

我并不过分责怪 Jensen 作为一个资本家,愿意把产品卖给任何想买的人,并把决定他获准卖给谁的问题留给其他人。问题在于,他一直试图误导我们,以获得许可。

在这些交锋中,确实有人试图为 Jensen 辩护,你点进去就能看到,但我也觉得那些论点相当站不住脚。 Ed Elson 的这篇算是我见过最认真严肃的一次尝试 ,但如果你认真推敲,他自己的比喻反而会导向相反的结论。

这里有一篇完整的解释,回应那篇提炼总结 

Peter Wildeford:Jensen 在这里既令人沮丧,也错得离谱。他已经为此冲销了数十亿美元,当然会反对管制。

1. Mythos 是一个约 10 万亿参数的模型,基于 Amazon Trainium 训练。尽管 Jensen 竭力争取,但由于出口管制,中国并没有 Blackwell 或类似性能的芯片。

Huawei 最好的芯片,单芯片性能只有其三分之一,功耗成本却高出 2.5 倍,良率还差了 12 倍以上。Jensen 把 Mythos 称为“相当普通的产能”,并称其在“中国供应极其充足”,这完全不符合事实。

2. Dwarkesh 关于算力比率在地缘政治层面至关重要这一点是对的。在关键窗口期保持能力领先——哪怕只有 12 至 18 个月——正是实施管制的全部意义所在。中国运行一千个还是一百万个进攻性 AI 智能体,差别巨大。Jensen 对此完全避而不谈。

3. Jensen 不可能一边主张“管制失败了,因为中国反正还是会创新”(DeepSeek),一边又说“我们必须向中国出售产品,否则他们就会脱离我们的生态系统”。如果他们无论如何都会创新,那么卖芯片并不能换来他所声称的那种忠诚。

4. Jensen 关于生态系统黏性的论点(x86、Arm)是他最有力的论据,但这恰恰也对他不利:世界实际上早已被锁定在 CUDA 生态中。向中国出售 NVIDIA 芯片并不会加深这种锁定——它只会在中国无论如何都会打造 Huawei 替代方案的同时,给中国提供更好的硬件。

一个显而易见、也被不少人反复强调、我同样注意到的观点是:如果中国有足够的能源来使用无限量的芯片,那就更有理由不要把芯片卖给他们。

Theo Bearman:Jensen 谈中国:“他们拥有的能源数量令人难以置信。不是吗?AI 是一个并行计算问题,不是吗?既然能源几乎是免费的,他们为什么不能把 4 倍、10 倍那么多的芯片堆在一起?他们有如此充足的能源。他们有完全空置、却已全面通电的数据中心。你知道,他们有鬼城,也有‘鬼数据中心’。他们有如此庞大的基础设施容量。如果他们愿意,即便是 7 纳米芯片,他们也可以把更多芯片组到一起。”

这正是为什么我们需要在整个半导体制造链条的所有环节上加码出口管制,而不是帮助中国最大限度地利用其现成可部署、已接通电力的机房外壳,以及领先的美国 GPU,外加“全球 50%的 AI 研究人员”这一优势。美国目前并不具备这样的条件,因为电力和制冷组件、审批流程以及数据中心建设都存在较长的前置周期。

如今,既然英国人工智能安全研究所(UKAISI)表示,AI 能力如今每四个月就会翻一番,那么黄仁勋试图让中国深度依赖美国技术栈这一战略的最终结果只会有一个:西方在 AI 领域优势的拱手让出,而且很可能是永久性的。诚然,大力加强出口管制或许存在弊端,但另一种选择要糟糕得多。

Peter Wildeford:Jensen 显然也在 Dwarkesh 的节目中无意间为出口管制提供了论据:

“他们(中国)有一些数据中心完全空置着,电力都已接通。你知道他们有鬼城,他们也有‘鬼数据中心’。”

可以想象一下,如果中国拿到了这些芯片会怎样!

Peter 还解释称,Huawei 目前只能满足中国市场需求的 1%至 4%,而无论如何,中国政府都会确保对 Huawei 芯片存在无限需求;一旦时机到来,如有必要,他们也会把 Nvidia 挤出市场以实现这一点。

是的,Huawei 的产量会随着时间推移而扩大,不过短期内由于瓶颈因素,这种情况可能不会发生。但即便他们做到了,中国市场的需求也会同步增长,而且即便凭借一款较逊色的产品,也并不明显表明他们正走在追赶上的道路上。

或者用 Benjamin Todd 的话来说 

关于 Dwarkesh Patel 对 NVIDIA 首席执行官 Jensen Huang 的播客访谈

这与深信超级智能有关吗?

这当然是你如何看待此类论点的一个重要因素,而且这种看法完全合理,但正如我通篇所说,我认为,即使你并不相信 AGI/ASI,也仍然可以认为 Jensen 在出口管制问题上是错的。

Sriram Krishnan:这里每个人对 Jensen 与 @dwarkesh_sp 播客的反应,都可以*直接*从他们是否相信前沿实验室能在较短时间内实现 AGI/ASI 推导出来。

如果你相信这些实验室会在未来几年内实现 RSI,继而实现 AGI/ASI(无论你如何定义这三者),你很可能会认同 @dwarkesh_sp 所采用的框架。

如果不是这样,你大概会更认同 Jensen 的论点。

(如果这里有人不符合这种模式,我很想听听!)

我会这样表述:

  1. 如果你认为 AGI/ASI 在中期内(即大约 10 年以内)是有可能实现的,那么 Jensen 反对出口管制的论点就完全站不住脚。

    1. 你仍然可以提出一些反对出口管制的论据,这些论据或许有一定道理,但我会把它们归为“脑洞过大的观点”。

  2. 如果你认为 AGI/ASI 在 10 年以上都不太可能实现,甚至也许永远不会实现,那么你或许应该对 Jensen 的论点更为开放一些,但基于我全文所论述的理由,你仍然应当否定 Jensen 的这些主张。

    1. Dean Ball 在这里提出了一个相关观点 。鉴于 Mythos,以及对未来几年 AI 能力的任何合理预期,你并不需要相信“AGI”,你只需要相信 AI 具有重大的战略意义,而我们今天已经处于这样的现实之中,这就足以推翻 Jensen 的论证。

  3. 如果你不仅不相信 AGI/ASI 是可信的,而且还认为从中期来看,谁能够获得大部分算力并不会产生太大影响,同时人们使用谁的模型和应用也并不那么重要,那么且只有在这种情况下,Jensen 的论点才是有力的。

    1. 也就是说,你认为 AI 不会产生太大影响,所以还不如靠芯片赚钱。

    2. 但如果真是这样,你大概也应该做空整个市场,尤其是 NVIDIA。

    3. 你在做空市场吗?

    4. 而且,现实根本不是这样的世界。在 Claude Code、Codex、GPT-5.4、Opus 4.6+和 Mythos 的共同作用下,我们已经排除了这种可能性。

  4. 你可以为 Jensen 的论点构建一个最强版本——David Sacks 等人也提出过类似观点——即 NVIDIA 硬件和 CUDA 在中国占据主导地位,也会带来美国模型和应用的主导地位,因为它们共同构成了一个连贯统一的“技术栈”。

    1. 我认为,这一论点在实质上站不住脚,而且有多重充分理由,即便你不相信 AGI/ASI 也是如此,因为它描述的是一个并非我们所处其中的世界。

    2. 我可以想象这样一个世界会存在,但它的样貌将截然不同。

我们该如何看待 Jensen 未能提出更有力论据这件事?

Dean W. Ball:很遗憾,Jensen 在这里基本没能说服人,因为围绕出口管制形成的单一思维生态并不是好事。若你是一名想要崭露头角的年轻 AI 政策研究者,除非你支持出口管制,否则几乎不可能被认真对待。单一思维生态通常都不是好事。

政策辩论不应呈现一边倒,除非争论的双方是:

  1. 让其他所有人的处境变得更糟,这样我就能赚更多钱。

  2. 不。

第一种立场往往会在这类辩论中胜出,因为特殊利益集团对集中收益看得很重,而其他人对分散成本的关注则较少。但确实,在有人寻租,或试图做出破坏性行为的情况下,围绕其正当性的政策辩论会呈现出非常一边倒的局面。

如果政策辩论是一边倒的,我希望相信政策辩论就是一边倒的。

如果政策辩论不是一边倒的,我希望相信政策辩论并不是一边倒的。

因此,如果确实存在反对出口管制的充分理由,我们希望听到这些理由,即便我们最终认为出口管制是有益的。此外,如果这些理由确实存在,我还没有听到。

缺乏足够的“觉醒”也是为什么 Jensen 会“失去” Anthropic;同样,这也是现任美国政府一度试图“失去” Anthropic 的重要原因之一,而在那个时候,这样的错误就更难以理解了。

Dean W. Ball:在这方面,Jensen/Dwarkesh 对谈中最有意思的时刻,不是关于芯片出口管制的争论,而是 Jensen 提到,几年前 Anthropic 找上门谈对其进行投资时,他并不理解他们的扩展需求。他承认自己当时还没有“开窍”。

Biden 政府的官员和 EA 群体,在 Jensen 看来对技术一窍不通,但几年前他们对 Anthropic 扩展需求的理解,其实会比 Jensen 在那次采访中承认的更直观。这无关精明或智力,而在于是否“开窍”。

Matt Beard 提出了一个极好的观点,并特别指出 Jensen 在试图淡化 TPU 时说过“尽管如今人们谈论的都是 AI”,所以没错,他显然还是很没“开窍”。

Jensen 的论点在逻辑和修辞上都很糟糕

一种论证糟糕,(至少)有两种情况。

  1. 一种情况是,论证在逻辑上站不住脚,而且本身也没有内在道理。

  2. 一种论证在修辞上可能很糟糕,也难以说服听众。

黄仁勋论点的问题,以及广义上的加速主义人工智能论点的问题在于,它们通常在第一种意义上站不住脚,而在第二种意义上也一贯表现糟糕,至少在适用于一般政治或公众时是如此。

Anton Leicht 正在警告加速主义者 ,他们正在缓慢但确定无疑地失去阵地。其策略一直是反对任何和所有诉求,坚持什么都不主张,打纯粹的强硬政治牌,却没有相应的论述和支持作为后盾;而且,不去尝试塑造最终规则、也不提前应对现实伤害,这种做法在某个时点之前或许行得通,但终将以灾难性的方式失灵。

认同这些论点的人一直都相当小众,而随着 AI 能力不断进步,这一点每天都变得更加明显,包括今天随着 Opus 4.7 的发布也是如此。

Dean W. Ball:Dwarkesh/Jensen 的这场对谈揭示了,支持加速发展 AI 的论点是多么缺乏一致性、又多么未经实战检验,尤其是在经过企业传播和大众政治这两重棱镜过滤之后。具有战略一致性的加速主义是可能的(我就在努力!),但目前并不普遍。

我确实是从加速主义者的根本立场出发说这番话的。一直以来都很清楚,默认的 AI 加速立场——尤其是在 SB 1047 期间形成的那种——不可能经得起时间的考验(反对 1047 的默认论点建立在这样一种判断之上:AI 不会有太大进步,并且把扩散描绘成“一个完全无解的神秘问题”,而不是“一个障碍”;这基本上仍然是默认的 AI 加速论点),而且必然需要一条新的、更加复杂的路径。

我一直试图以我自己那种大多点到为止的方式勾勒这一路径,但此刻我想明确指出:对于那些对 AI 感到振奋、认为其顺利发展的可能性更大(尤其是在重大风险得到妥善管理、并以清醒自觉的战略执行加以应对的情况下),且希望积极迅速拥抱它的人来说,显然需要一种新的方法。

Dean W. Ball:不过,必须承认的是,尽管 Jensen 是在话锋回撤、边说边退的时候讲出这句话的,“那个失败者前提在我看来毫无道理”这句话本身还是很有冲击力。

关于 Dwarkesh Patel 对 NVIDIA 首席执行官 Jensen Huang 的播客访谈

Nathan Calvin:总的来说,这场采访结束后,我丝毫没有被 Jensen 的论点说服,但我确信,这个人是一股不可阻挡的力量,而且带着一种冷酷、原始的技术资本主义者式的酷感。

Dean W. Ball:从某种意义上说,这种炫耀一直都是逻辑上的自相矛盾

我认为,“失败者前提在我看来毫无意义”这句话极能揭示 Jensen 的心理。

我认为这是因果关系。也就是说,如果那个前提会让我变成一个失败者,那么它就说不通。

因为如果说有一件事是你需要了解 Jensen Huang 的,那就是:他是个赢家。

了解 RecodeX 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读