软件曾统治世界,如今硬件正在吞噬软件
在上一个软件发展周期中,主流的观点认为价值会向软件栈的上层移动——也就是向应用、工作流程、数据记录系统以及最终销售的产品本身流动。对于 SaaS 而言,这种情况确实存在:每多服务一名用户的边际成本几乎为零,因此那些拥有用户界面的人就能获得 75%到 90%的高额毛利率。
AI 打破了这一传统格局。价值重心正在向技术栈的底层移动,转向那些资本投入最高、物理约束最严、控制力度最大的层面:半导体与计算设施、数据平台、开源模型以及运行这些模型的推理引擎,还有一小部分处于高端地位的产品。应用层并未消失,但已变得更为薄弱。随着推理功能转变为产品的变动成本,其利润空间不断被压缩;与此同时,相关估值标准也出现了分化——模型和数据的估值持续上升,而应用层的估值则保持不变。
简而言之:未来将是大量开源模型(以及用于运行和优化这些模型的推理平台)、数量较少的优质模型、数据平台,还有为这一切提供支撑的半导体,而处于最上层的应用软件层则会比 SaaS 时代我们所习惯的更为纤薄。

这种趋势出现了逆转。
这与过去 20 年来私人资本的传统思维完全背道而驰。互联网泡沫破裂后,投资者纷纷撤离资本密集型且具有周期性的半导体行业,转而大力投资轻资产的云计算和软件业务——这些行业拥有 80%以上的毛利率、近乎为零的边际成本、稳定的经常性收入,以及极高的资本使用效率,因而能带来市场上最高的估值倍数。“软件正在吞噬整个世界”成为了那一代投资基金的核心理念;有限合伙人和普通合伙人也都围绕应用软件展开布局,而半导体行业则被视为估值较低、具有周期性的次要领域。
AI 打破了这一趋势。资本再次流向那些该行业曾花费二十年时间试图摆脱的、需要大量资金的实体层面——芯片、封装、电力供应、数据基础设施以及顶层的推理系统。在科技领域,最具价值的依然是芯片公司;而增长速度最快的基础设施业务则是推理平台和数据平台。曾经被视为最理想的轻资产应用层,如今却拥有整个技术架构中最低的利润率。二十年的惯性思维正在引导人们走向错误的方向。
框架:价值具有向下的引力
可将 AI 技术架构视为五层,并针对每一层提出一个问题:下一单位的价值有多容易被替代?与质量类似,价值也会积聚在那些难以流动的地方。有四种因素会将价值拉向架构的底层并使其滞留于此。
- 资本密集度。这些底层基础设施的建造成本高达数百亿美元,且需要持续投入。四大大型云计算企业每年的资本支出均在 5000 亿美元以上,到 2026 年这一数字还将上升至 6000 亿美元以上。当资本规模庞大且始终不可或缺时,它便能构成难以逾越的竞争壁垒。
- 物理瓶颈。先进封装技术(CoWoS)、高带宽内存以及电力供应都是难以突破的限制,企业无法为了短期盈利而忽视这些问题。谁能够掌控这些限制因素,谁就能获得优势。
- 转换成本与惯性。从本质上讲,数据具有“引力”:凡是已经搭建好的数据管道、表格以及训练完成的模型,都会增加脱离它们的成本。而开放权重则恰恰相反——它被设计为可移植的,正因如此,该层面的价值才从模型转移到了为其提供支持的平台上。
- 表面上看存在替代风险。在整个技术架构中,通用的应用逻辑是最容易被替代的,因为模型越来越能够直接承担这些功能。
本文的其余部分将通过数据,从底层逐步向上剖析这一技术架构的转变。

第一层——半导体与计算能力:密度最高的环节
这是最底层的基础架构,而且其重要性还在不断上升。在截至 2026 年 4 月的最新财报季度中,NVIDIA 的数据中心业务营收达到了 752 亿美元,同比增长 92%,毛利率高达 1001#75%;按此速度计算,其年度营收规模约为 3000 亿美元,而本季度的营收预计将达到 910 亿美元。从营收占比来看,NVIDIA 占据了大约 80%的 AI 加速器市场份额。这已不再是竞争激烈的商品市场的经济模式,而属于掌控核心要点的经济形态。
其背后的需求是一场在企业技术领域前所未见的资本支出超级周期。仅 2026 年第一季度,四大大型科技巨头就投入了约 1310 亿美元用于资本支出——Amazon 为 442 亿美元,Alphabet 为 357 亿美元,Microsoft 为 309 亿美元,Meta 为 198 亿美元——按年化计算这一数字高达 5250 亿美元,而 2026 全年的预计资本支出额还将继续上升,有望突破 6000 亿美元大关。高盛预测,从 2025 年到 2030 年,这些大型科技巨头的累计资本支出总额将达到 5.3 万亿美元。

涉及的并非仅有计算能力而已。整个半导体行业正处于超级周期之中:2025 年的全球营收已达 7930 亿美元(同比增长 21%),预计 2026 年还将接近 1 万亿美元(WSTS 预测为 9750 亿美元,同比增长 25%;Gartner 的预测数值更高)。目前人工智能已占据半导体总营收的 30%,到 2029 年这一比例还将超过 50%。相关需求可分为三类,而这三类都面临供应瓶颈。其中规模最大的是计算相关产品——包括逻辑芯片、GPU 以及加速器——仅人工智能加速器的市场规模就从 2024 年的 800 亿美元增长到 2029 年的 2800 亿美元以上。内存领域的变化最为迅速:2025 年 HBM 的需求增长了 1004#130%,2026 年还将再增长 1005#70%;2026 年第一季度,传统 DRAM 的合同价格环比上涨了 1006#90%。目前,AI 数据中心消耗了大约 70%的高端 DRAM。存储领域的情况也在逐渐紧张:2026 年 NAND 市场的规模将达到 1007#$650 亿美元,如今每五比特数据中就有一比特用于 AI 应用,而且到 2027 年,其需求增速(20–22%)仍将高于供应增速(15–17%)。当某个终端市场在单个季度内就将 DRAM 的价格上调 90%,并提前两年规划先进封装技术时,盈利能力与利润空间便已转移到了物理层。

这一层之所以能够保持稳定发展,而非仅仅因为规模庞大,主要得益于两个因素。首先,制约因素已从芯片设计转向封装与能耗方面。台积电的 CoWoS 封装产能在 2025 年约为每月 7 万片,到 2026 年还将进一步提升至约 11 万片,目前这些产能实际上已经全部被预订一空,而 NVIDIA 也占用了 2027 年大部分的供应量。其次,2025 年就有超过 10 吉瓦的新 AI 数据中心建设计划,而现有的封装产能仅能支撑大约 18 吉瓦的运算需求。当瓶颈来自物理层面时,高昂的资本投入就成了现有企业的优势,同时也成了新进入者的障碍。
The replacement risk here is real but slow: hyperscaler custom silicon (Google TPU, AWS Trainium, Broadcom ASICs) is growing into a $200B+ accelerator TAM. It compresses NVIDIA’s share over time; it does not move value out of the layer. The mass stays at the bottom.
这一层面的真正风险在于投资回报,而非营收。在每年超过 5000 亿美元的资本支出规模下,加之那些使用寿命仅为两到三年的加速器设备,要维持合理的利润率,就必须确保高利用率,从而从已部署的设施中获得回报。正是这一点——而非竞争——成为影响整个技术架构的最关键因素。
二层网络——开放模型与推理:模型端侧重数量,平台端侧重价值
在过去的 24 个月里,人工智能领域最重要的量化趋势便是各种模型的融合发展。根据斯坦福 AI 指数显示,Chatbot Arena 平台上表现最佳的封闭模型与最佳开源模型之间的差距已从 2024 年 1 月的 8.04%降至 2025 年 2 月的 1.70%。在 MMLU 测试中,两者之间原本存在的 1001.5 分的差距也几乎完全消失了。DeepSeek R1 的出现表明,要实现顶尖水平的推理能力并不一定需要高达数千万美元的训练成本;而在 Hugging Face 平台上,Qwen 的下载量也已超越 Llama,成为下载量最高的模型系列。

如今的供应端实际上已近乎无限。Hugging Face 上托管的模型数量超过 220 万,其模型库的数量大约每 24 个月就会翻一番。当某种功能存在数千种几乎相同的开源版本时,模型权重本身就不再属于稀缺资源。真正稀缺的,反而是高效运行这些模型的能力——包括处理速度、延迟、每条消息的处理成本、路由机制、缓存策略、微调方法、评估标准以及相关约束条件。
有一个市场结构方面的变化值得投资者关注:开源领域的主导力量正逐渐从美国转向其他地区。2024 年 8 月至 2025 年 8 月期间,中国开发者在 Hugging Face 上的下载量占比达到了 17.1%,超过了占比 15.8%的美国开发者;同时,Qwen 也取代 Llama 成为下载量最高的模型系列。而那些日益商品化的技术层,恰恰也是最不受美国现有企业掌控的领域——其影响因素更多是供应链与政策因素,而非单纯的经济因素。
Linux 并未掌握其带来的价值,真正获利的是 Red Hat 和云服务厂商。如今,开放权重也遵循同样的规律——价值属于为这些权重提供服务的平台,而非模型本身。
正因如此,这一层中具备持久发展潜力的业务是推理与优化平台,而非开放模型。该平台介于丰富的开放资源与企业需求之间,通过将唯一无法被商品化的要素——即让可移植的程序在实际应用中稳定且低成本地运行——转化为商业价值来实现盈利。
市场正在以基础设施软件领域前所未有的速度实时印证这一趋势。Fireworks AI 在大约三年时间里就实现了 8 亿美元的年化营收,同比增长幅度超过 4 倍。据传闻,Together AI 的规模也相当可观——Baseten 的营收已达到 6 亿美元,同比增长超过 5 倍。这些公司并非模型研发机构,而是让开源模型能够在实际应用中得到使用的关键载体。既然模型本身是免费的,那么那些能够以最快、最低成本提供相关服务的公司就能获得市场收益。
其中的数学原理正是原因所在。以一个每月处理 500 亿个输出 token 的团队为例——这属于中等规模的 AI 应用。按照 frontier-API 每百万 token10–15 美元的定价标准,其每月成本约为 50 万–75 万美元;而如果使用 Llama、Qwen、DeepSeek 等开源模型,并通过推理平台来处理相同的工作量,每百万 token 的成本仅为 0.40–1.00 美元,相应费用仅为 2 万–5 万美元,成本降低了 90%以上。随着质量标准不断降低,开源模型结合推理平台的方案在成本上更具优势,而提供该服务的平台则能将节省下来的部分作为利润。这就是整个商业模式的运作方式。(此为示例,实际成本会因模型类型、上下文长度及使用率的不同而有所差异。)
第 4 层——数据平台:不断加剧的“引力井”
如果半导体属于最核心的层级,那么数据平台则最为难以摆脱其束缚。这正是“数据引力”的真实写照:每新增一个处理流程、数据表或本体结构,要脱离数据平台的成本就会随之上升。
数据表明,直接承担人工智能计算任务的层级正获得市场的高额估值。Databricks 的年化营收已突破 69 亿美元,增长率高达 1001#80%,其人工智能产品所占营收比例已达 1002#26%,该公司的私有化估值约为 1700 亿美元。Palantir 则负责将企业数据转化为可依据的决策,2026 年第一季度的营收同比增长了 85%,为有史以来最快的增速,其年化营收达 65 亿美元;美国市场的商业营收增长了 133%,“40 法则”得分则为 145%。鉴于其 3500 亿美元的市值,市场为其赋予了类似基础模型级别的估值倍数——大约是营收的 50 倍——因为该公司掌控着基于数据生成的决策流程。

为何价值会集中在这里,而却在模型层流失?因为数据是唯一既不可替代又能持续创造价值的输入要素。模型可以趋同,但企业的专属数据以及基于这些数据构建的工作流程和本体结构却不会。随着模型层逐渐变得商品化,拥有数据及决策流程的平台便成了最具可持续优势的焦点。这实际上颠覆了传统的应用层价值逻辑:那些获得最高估值的领域——Palantir 的估值是其营收的 1001#50 倍,基础模型的估值则在 25 至 50 倍之间——正是与专属数据相结合的领域,而非那些通用的软件层面。
第 5 层——应用层:其厚度比 SaaS 方案中所假设的要薄。
现在来看核心观点。其论点并非应用程序会消失,而是通用型应用层的功能日益精简,且这种变化可以通过两种可量化的指标体现出来。
首先来看利润率。传统的 SaaS 业务由于服务成本几乎为零,其毛利率可达 75%至 90%。而基于 AI 的应用程序则只有 50%至 60%的毛利率,因为每次查询都需要重新运行模型。根据 ICONIQ 在 2026 年收集的数据,在那些不断扩张的 AI 企业中,推理成本平均占营收的 1001#23%——关键的是,与 SaaS 业务的成本结构不同,这一成本并不会随着业务规模的扩大而下降。那些采用极简架构的应用程序,其毛利率甚至可能只有 25%。实际上,推理成本属于一种结构性且会随需求变化的商品成本。
其次是估值倍数。市场早已反映了这种分化趋势:基础模型公司的估值为其营收的 25 至 50 倍;原生 AI 平台则为 25 至 30 倍;传统 SaaS 的估值中位数已降至 10.7 倍(2021 年时曾高达 18.6 倍);而“AI 封装层”产品的估值则在 5 至 8 倍之间,与传统 SaaS 相当或更低。价值会向模型和数据倾斜,而那些缺乏差异化的产品则会被低估。

这并不意味着“不应在应用程序上投资”。而是说标准已经发生了变化。如今,一个可持续运行的应用程序需要一些模型无法处理的东西:专属的数据循环、记录系统、受监管的工作流程、真正的分发机制,或是能够将推理成本转化为利润的基于结果的定价方式。如果没有这些,那么该应用程序就只不过是在日益商品化的模型之上加了一层简单的提示与拼接功能而已——各大投资机构也会这么看。
反论点:什么会证明我是错的?
“决定性”并不意味着“不可证伪”。有三项发展态势可能让价值重新向上层流动。
应用负责掌控数据流转环节。如果那些最优秀的应用能够足够快速地积累独有的交互数据,它们就会演变成独立的数据平台,并随之拥有强大的数据吸引力。这正是支持应用层发展的最强有力论据,也是为何作为核心记录系统的应用能够免于出现功能弱化现象的原因。
垂直整合打破了原有的层级结构。那些拥有推理能力、能够构建智能体并直接销售应用的高端实验室,可以同时将这三层中的价值重新收归自身掌控。这样一来,价值被集中而非向上分配——但与此同时,独立的推理层与应用层也会随之削弱。
AI 推理功能的商品化进程比预期还要快。所谓的“LLM 通胀”现象——即每单位智能服务的成本以每年约 10 倍的速率下降,而自 2024 年初以来其价格中位数更是以每年近 200 倍的幅度下跌——其实有着双重影响。如果提供这类服务几乎不再需要成本,那么 AI 应用领域的毛利率就会恢复到 SaaS 行业的常规水平,这样一来,“利润率不断缩水”这一观点的合理性就会减弱。(不过,那种认为利润率会持续减半的观点在很大程度上依然成立,因为决定利润率的是产品的替代性,而非成本。)

需要注意的是其中存在的矛盾:正是那种给半导体及推理层带来价格压力的成本下降趋势,反而可能让应用层的利润空间问题只是暂时的。相比成本下降带来的好处,我更看重上述的结构性变化因素,因为即便推理成本降为零,替代风险依然存在。
影响
致投资者:应关注控制环节而非界面层面。最具投资价值、最难被替代的领域包括:计算能力及其相关的物理瓶颈(封装、电力供应、内存);具备独特优势并能持续创造价值的数据平台;以及能够利用海量开源模型实现盈利的推理/优化层。在高端投资类别中,应重点关注前沿技术及配套的分布式架构,并筛选出那些胜出概率低于市场普遍预期的标的。至于应用层,只有在存在完善的数据循环或记录系统的前提下,才值得给予较高的软件估值倍数——并且在有相反证据之前,应假设其毛利率在 50%至 60%之间,而非 80%以上。
致创业者们:如果你们正在开发应用程序,那么你们的任务就是创造“数据引力”。要么拥有专属的数据循环,成为数据记录的枢纽,要么按照成果定价,这样不断下降的推理成本就能增加你们的利润,而非让客户节省开支。“轻量化”只是默认模式,并非必然选择。
对于现有企业而言,底层基础设施的高资本投入其实是一种可以“租用”而非“拥有”的竞争壁垒。对大多数企业来说,更可行的策略是在数据层面下功夫——将数据存储、模型训练与服务处理集中在同一平台,而非在计算能力或前沿模型方面展开竞争。
什么能够证实——或推翻——这一点
未来四个季度里的五个可量化指标将表明这一庞大的技术架构是否能够维持稳定:
- 大型科技公司的资本支出与营收比率。如果这一比例持续高于营收的 100%–30%,且利润率依然保持稳定,那么底层基础设施能够创造收益的论点就成立;一旦 ROIC 出现下降,整个技术架构的估值都将随之调整。
- 推理平台的年度经常性收入方面,Fireworks、Together 以及 Baseten 的营收均以复合增速不断增长,预计每家都能达到 10 亿至 20 亿美元的水平,这一迹象表明价值正集中在推理层,而非模型层面。
- 开放与封闭的差距。如果其在各项硬性测试指标(如智能体功能、编程能力)上的得分始终保持在~2 分左右,那么模型层就会陷入商品化困境。
- AI 应用的总利润率。如果 AI 应用的利润率能保持在 50–60%的水平(且随着规模扩大推理成本不会上升),那么“利润率持续下降”的观点依然成立;而若该比例能回升至 75%以上,则这一观点就会被削弱。
- DRAM 与 HBM 的定价情况。价格仍以两位数幅度持续上涨,这表明物理限制以及相应的利润空间依然是决定盈利水平的关键因素。
摘要:按概率加权,3–5 年

在各种可能性较高的投资方向上,该建议都保持一致:应将投资重点放在垒与数据层层面,把高端产品线视为风险较低、确定性较高的投资选择,而对于应用程序,则需有更高的标准——也就是要形成数据循环或具备完整的记录系统,之后才能按照软件行业的估值倍数进行投资。正是“数据引力”在驱动着这一切,因此应把资金投入到那些最具价值的核心领域。
数据来源:NVIDIA 2027 财年第一季度业绩报告(2026 年 5 月);Amazon、Alphabet、Microsoft、Meta 等公司 2026 年第一季度的盈利情况;斯坦福 HAI 2025 年 AI 指数;Hugging Face;Epoch AI;Andreessen Horowitz 发布的“LLM 通胀”相关报告;Gartner 与 WSTS 提供的半导体行业营收数据;TrendForce 与 Counterpoint 发布的 DRAM、NAND 及 HBM 行业数据;BofA 的调研报告;Databricks 与 Palantir 公开的信息;OpenAI、Anthropic、Fireworks AI、Together AI、Baseten 通过 Sacra/PYMNTS 公布的数据;ICONIQ 发布的 2026 年 AI 行业现状报告;高盛的报告;ValueAddVC 与 SaaS Capital 的调研成果。私营企业的营收增速是依据不同标准统计的;2026 年底的模型实验室相关数据均为估算值。
