AI 进展:冷战 2.0 的战场
本文信息来源:contrary
美中人工智能竞争已从单纯的技术霸权竞赛演变为复杂的生态系统博弈,不同路径可能共存甚至相互补充。至少目前是这样。

当一家鲜为人知的中国初创公司 DeepSeek 于 2025 年 1 月 20 日发布其 R1 模型时,它以性能震惊世界,表现匹敌如 OpenAI 的 o1 等顶级系统,且据称成本仅为 6–7%。仅仅在七天之后,DeepSeek 超过 ChatGPT,成为美国 iOS App Store 下载量最高的免费应用,并在单日内导致美国股市抹去约一万亿美元的市值。
DeepSeek 的成就是在美中之间持续进行的人工智能“军备竞赛”中取得的。美国采取产业主导、以算力为核心的方法,押注通过积累强大算力资源(如 NVIDIA 的 H100 芯片)并在前沿模型开发上投入巨资来赢得这场竞赛。但 DeepSeek 的出现对这一模式提出了挑战,声称用更少的芯片和更小的预算就能取得相同成果。曾经认为中国在 AI 发展上至少落后美国“数年”的美国专家们,被一种迫在眉睫的可能性所震惊:凭借更高效、更具成本效益的生态系统,中国可能正在缩小与美国在 AI 发展上的差距。
然而,事实比“中国的 AI 生态系统正在‘赢’”这一叙述要复杂得多。虽然 DeepSeek 的 R1 模型确实标志着模型开发上的一次重要飞跃,但这一成果为何出现并不像 DeepSeek 希望世界相信的那样清晰。此外,中国更广泛的政治环境和发展基础设施可能会阻碍未来加速进展。
两种不同的方法
美国路径:由资本市场驱动、算力充裕
美国的做法可以概括为一种充满活力、由资本市场驱动的发展模式。私人公司和投资者主导着美国的人工智能资金投入,这促成了资源的灵活配置和基础设施的快速扩张以满足需求。
美国公司用于训练人工智能模型的算力需求远远超出传统预期。但美国的人工智能生态系统能够跟上这种指数级的进展。例如,自 2012 年以来,用于顶级 AI 训练的算力大约增长了 300000 倍(每约 3.4 个月翻一番),远远超过摩尔定律两年翻一番的基准。公开数据证实,OpenAI 的数据中心集群已达 100000 块 GPU,计划在 2025 年底前超过 300000 块,反映了其激进的基础设施扩张。尽管竞争对手在争夺最强模型方面相互竞争,但他们在关键算力资源上出人意料地愿意共享。2025 年 6 月的一份报告显示,OpenAI 正在接入 Google Cloud 的 TPU,减少对 Nvidia GPU 的单一依赖。
私人投资也跟上了计算需求的指数级扩张。美国在人工智能领域的私人投资在 2024 年达到 $1090 亿 ,几乎是中国投资额的 12 倍 。如果在 2025 年 1 月宣布的 Stargate 计划得以实现,OpenAI 将在未来四年内投入 $5000 亿用于建设新的人工智能基础设施。由软银、Oracle 和 MGX- 支持的这项努力将提高美国在全球人工智能计算能力中近乎三分之二的占比。得益于充裕的资金和更大的总体计算能力,美国能够支持一个多元化的领先人工智能公司生态系统并进行更多实验迭代。例如,谷歌、Meta 和 OpenAI 等美国机构在 2024 年推出了 40 个值得注意的人工智能模型,远超中国的 15 个。展望未来,美国的计算主导地位意味着美国实验室可以并行训练多个前沿模型并大规模部署人工智能服务。 相比之下,中国将需要对其资源进行更为选择性的使用,理论上这将导致创新放缓。
除了计算资源的优势外,美国生态系统最大的强项或许在于市场力量如何有效地将投资与现实需求对接。由于大多数美国的人工智能开发由私营部门驱动,诸如云数据中心和芯片供应等资源往往会根据实际需求信号扩张(或收缩)。例如,CoreWeave 和 Core Scientific,两家曾经的比特币矿业公司, 转型为面向人工智能的云计算服务商,以应对对大规模计算能力和大型数据中心日益旺盛的需求。这种随需而变的扩展有助于避免严重的产能过剩或硬件闲置。此外,美国充满活力的开源人工智能社区(以像 PyTorch 和 HuggingFace 等工具为代表)创造了能够降低实现和维护成本并加速专有人工智能工具实现价值的工具。总体而言,美国模式可以概括为资源充足且优化到位:充沛的计算能力、一流的人才、私人资本和配套基础设施的结合,共同维持了该国在人工智能开发方面的领先地位。
中国的路径:国家主导的雄心与挑战
在中国的人工智能生态系统中,国家在设定优先事项和引导投资方面扮演着更加突出的角色。自2017年起,北京已将人工智能宣布为国家战略优先事项,政府指令和资金推动了全国范围内的热潮。
这种自上而下的推动有其优势。例如,中国迅速建立起的人工智能研究项目在近年来在 AI 研究论文和专利数量上全球领先。到 2023 年,中国占全球所有人工智能专利申请的近 70%,并在 2025 年 5 月占全球顶尖人工智能研究人员的 47%,反映出巨大的研发推动力和知识产权产生潜力。这表明,尽管在资源上相对落后于美国,中国的人工智能研究群体仍可能保持同步发展。
DeepSeek 展示了中国 AI 人才克服地缘政治挑战并推动创新的实力。该公司在 2024 至 2025 年间在 arXiv 上发表了 五 篇重要论文,作者总数达 223 人。团队的学术资历令人印象深刻;平均而言,每位 DeepSeek 研究人员发表了 61 篇作品并获得了超过 1K 次引用,而贡献了所有五篇 arXiv 论文的核心 31 位研究人员,其每位作者平均获得了 1.5K 次引用,中位 h 指数为 10;h 指数是一项用来评估科学家或学者研究产出重要性的指标。这一表现优于 OpenAI 的 o1 团队,其中位 h 指数仅为 6。值得注意的是,超过 一半 的 DeepSeek AI 研究人员仅在清华、北大、南京等中国顶尖高校接受培养。
由于团队在研究方面的实力,DeepSeek 得以规避限制获取先进芯片的严格出口制裁 ,并开发出性能可与美国最先进模型(SOTA)相媲美的模型。在一项关键方法中,公司采用了专家混合(Mixture-of-Experts,MoE)架构。MoE 并不像每次查询都激活大型神经网络的每一部分(就像每个想法都动用整个大脑),而是将模型划分为更小的专门专家模块,仅调动对回答特定问题相关的专家。其结果是模型节约资源,大幅降低训练和推理成本,同时不牺牲能力。
事实上,MoE 据称允许 DeepSeek 用远少于以往的芯片训练超大模型。DeepSeek 团队声称他们只用大约 2K GPUs 就训练出了他们的 V3 模型,而领先的 AI 公司通常使用的则是 16K。在另一关键方法中,DeepSeek 依靠强化学习(RL)来训练其 R1-Zero 推理模型,完全< a id=4>放弃了代价高昂的监督微调(SFT)阶段,且< a id=5>取得了与美国公司的最先进(SOTA)模型可比的结果。DeepSeek 注重效率的做法带来了惊人的模型性能飞跃,凸显了中国自上而下方法中成功的部分。
来源:arXiv
在国家主导的人工智能投资策略中,不太成功的方面体现在因运营经验不足和目标短视而产生的阵痛和低效。为了抢占人工智能领导地位,行业协会披露该国过度建设了计算基础设施,导致大量产能闲置。例如,截至 2024 年底,至少有 150 个数据中心建成 ,但其中多达 80% 的资源未被利用。这些设施反而变成了问题资产,投资者试图以低于市场价的价格抛售 。实际上,大量装满服务器的数据机房运行在半载或更低水平,因为预期中的人工智能工作负载洪峰尚未出现。
根本原因在于许多项目在审批时几乎不考虑实际需求或技术可行性。申报项目的竞赛更多是由炒作和政治压力驱动,而非市场需求。尽管中国的人工智能热潮在 2024 年曾有超过 144 家企业在国家网信办登记要开发大规模语言模型,但热潮很快失去动力,截至 2024 年末 ,仅约 10% 仍在积极投入大规模模型训练。在 DeepSeek 发布了其不依赖高算力预训练、成本更低的 R1 模型后,许多小型参与者已放弃对模型的预训练或以其他方式调整策略,只有少数中国顶级科技公司仍然大量依赖计算资源来训练其人工智能模型。因此,中国当局不仅未能预见这一朝向更廉价数据中心的格局转变,其在数据中心供应上的失调模式也反映了中国高度集中的政治体制。 在这一体制下,地方官员将短期、高调的基础设施项目置于优先,以提升仕途,而不是着眼于长期发展。
疫情后经济下行加剧了这一态势,官员们在曾长期作为地方经济支柱的房地产几十年来首次下滑后,争相寻求替代增长驱动力。在这一真空中,人工智能基础设施成为新的刺激选择。到 2023 年,包括莲花(MSG 生产商)和金轮科技(纺织企业)等此前鲜少涉足 AI 的主要企业,甚至一些不太可能的参与者 ,开始与地方政府合作以抓住这一趋势,常把 AI 基础设施视为为扩张业务或证成 、 提振股价的手段。这种淘金式做法促使建设 AI 数据中心而很少考虑实际用途, 由对 AI 基础设施了解有限的高管和投资者主导,他们在急于跟进的过程中匆忙建设了不符合行业标准的项目,最终未达标 。
中国人工智能生态系统的最后一道障碍是基础软件和工具链相对薄弱。尽管中国追求科技自立,但在开发工作中仍在很大程度上依赖以美国为基础的人工智能框架和平台。截至 2019 年,大多数中国 AI 实验室仍将开源工具如 TensorFlow(Google)或 PyTorch(Meta)作为模型训练的骨干,因为国内替代品寥寥且不够成熟。正如一位专家指出的那样,如果你的核心软件栈被另一个国家的生态系统主导,就很难宣称真正的 AI 领导地位。这种依赖引发了关于中国如何将其 AI 工作从外部控制中隔离的问题,特别是在制裁可能成为瓶颈、地缘政治形势发生变化的情况下。
结论是什么?
独特优势
美中人工智能竞赛已进入新阶段,双方生态系统各自展现出可能并存而非趋同的明显竞争优势。美国在算力方面仍占据压倒性领先地位,控制着全球约三分之二的 AI 算力,从而具备在大规模范围内部署 AI 应用的更强能力。然而,中国在 2025 年 1 月通过 DeepSeek R1 和 V3 取得的突破,根本性地挑战了关于算力资源与 AI 能力关系的既有假设。
这种分歧表明竞争格局更为微妙:美国在算力上的优势确实可促进更广泛的 AI 应用部署,例如 Meta 截至 2024 年 12 月已达到每月 6 亿活跃 AI 用户,Microsoft 的 Azure AI 截至 2025 年 5 月为超过 7 万家企业提供服务。与此同时,中国在效率方面的创新提出了棘手的问题 :原始算力的绝对优势是否能保证长期主导地位。关键的不确定性在于中国是否能培育出可与 Nvidia 抗衡的芯片制造商,有些报道称中国最先进的芯片华为的 Ascend 910B 已经比 Nvidia 的 H20 系列芯片落后了不到一代 。
人才流动也愈发有利于中国生态系统,截至 2024 年 4 月 ,全球近二分之一顶尖 AI 研究人员来自中国,且越来越多的人选择留在国内而非移民。美国仍保持质量优势,截至 2025 年 1 月 ,其顶尖 AI 博士研究人员数量比中国多出 90%,但在日益收紧的移民政策下面临越来越多的挑战 。
推理革命
AI 行业从训练转向推理优化,代表着一种根本性转变,偏向于分布式架构而非集中式 GPU 集群。不同于需要紧密耦合系统的训练工作负载,推理可以地理上分布 ,通过边缘处理实现亚 10ms 的响应时间,同时减少带宽成本。
这种架构演进对中国的做法尤其有利,因为推理工作负载对最先进芯片的依赖较低,而这些芯片正是美国出口管制最严格的领域。因此,专用推理硬件已成为一个关键的战场 。例如,在 Deepseek R1 成功后,中国科技公司纷纷抢购英伟达的 H20 芯片,导致英伟达受到审查 。尽管 H20 芯片属于受出口限制的版本,但在中国广泛被销售 。在某些使用场景中,这些芯片的推理性能甚至比 H100 提高了 20%。而且尽管面临反弹 ,英伟达似乎仍然决心向中国出售更多其旗舰芯片的出口管控版本。
经济优化也通过显著的成本下降推动了这一转型:推理成本从 2021 年每百万标记不到 $60 下降到 2025 年每百万标记 $0.06。换言之,LLM 推理成本在三年内下降了 1000 倍 。这种 AI 推理的商品化使得以前被认为在经济上不可行的新应用成为可能,同时也迫使美中企业在效率和分发而非单纯性能上展开竞争。
通过专业化实现共存
最可能的情景是双方生态系统在保持竞争能力的同时,专注于不同的优势。预计美国将继续凭借其算力优势和一体化生态系统(从 Nvidia 硬件到应用部署)在前沿模型开发上占据主导地位,而中国则在效率创新、成本效益部署以及服务受美国技术限制市场方面表现突出。
推理优化趋势通过降低对最先进训练基础设施的依赖,从根本上改变了竞争格局——美国在该领域占据最大优势。随着专用推理硬件的普及和成本持续暴跌 ,成功将越来越依赖部署效率和市场准入,而非纯粹的计算力。
因此,三大不确定因素将塑造这一演进:一是中国的效率创新能否克服半导体限制,实现真正的训练能力平衡;二是在移民限制和市场成熟的背景下,美国能否保持人才和创新优势;三是由国家或产业主导的某种 AI 发展路径是否被证明比另一种更为审慎。
影响与启示
美中人工智能竞争已从单纯争夺技术霸权,演变为一种复杂的生态系统对抗,不同的方法可能共存乃至互补。至少目前如此。尽管美国仍保持总体领先地位,中国的快速进展确保了持续的竞争压力,这最终有利于全球人工智能的发展。但这场特殊的竞争对更广泛的全球秩序具有更深远的影响。
从对台湾日益增加的侵略到对俄罗斯在乌克兰问题上的支持以及对伊朗的财政资助 ,可以明显看出美中两国的地缘政治目标正日益背道而驰。如果美中之间爆发全球性冲突,对美国的前景将不容乐观。自 2017 年以来,兰德公司一直在指出 ,“在合理假设下,美军在下一场被召去参战的战争中可能会失利。”与此同时,中国已成为一个强大的对手。中国企业占据商业无人机市场的 80%,造船能力比美国多出 536 倍 ,占全球制造业约 33%;更重要的是,中国愿意利用这种工业实力来实现其目标。
但在任何潜在冲突中,人工智能都是关键枢纽。盐、茶、石油,甚至核能力在历史上都曾引发过不少冲突。但人工智能代表着一种根本上自我强化的能力。换句话说,拥有最强人工智能的一方,更有可能利用该人工智能持续保持领先。显示人工智能优越性的竞赛远未结束。但这场竞赛的结果不仅关乎谁拥有最快的聊天机器人或最个性化的广告,它可能决定未来的世界秩序。