\n\n

404–Gen:从键盘到世界

本文信息来源:chainofthought

文本到 3D 的“圣杯”或许不会来自大型科技公司,而是来自一个 Bittensor 子网。

赛博朋克柴犬酒保,霓虹护目镜,调制饮品

这就是完整的提示。十秒钟后,它就以 3D 形式出现在你的 Unity 场景中,配有光照、纹理和深度。

我不是设计师,但我可以想象这几乎就像魔法一样。这就是 404–Gen,一个将自然语言转化为 3D 资产的去中心化网络。

“一个赛博朋克柴犬酒保,戴着霓虹护目镜,调制饮品” —— 404-gen

每个数字世界都会遇到同样的问题:3D 内容制作速度很慢。每个英雄都需要一把剑,每个关卡都需要成千上万个道具。在大型工作室里,内部的玩笑是某个设计师一年到头只是在制作木桶和板条箱(可能是真的)。

像 Ubisoft 和 Rockstar 这样的工作室会投入大批设计师来建模木桶和板条箱。业余爱好者几乎没有机会。如果你不会建模,你就无法构建。

404–Gen 作为 Bittensor 上的 Subnet 17 运行,这是一个去中心化 AI 协议。它不是单一模型,而是一个实时竞争的模型群。贡献者接入不同的方法,验证者对结果进行评分,代币流向获胜者。弱模型消失,强模型崛起。该网络已经生成了超过 2000 万个输出。

使命很明确:让任何有想法和键盘的人都能进行 3D 创作。不仅仅是游戏开发者或 VFX 团队,还包括独立创作者、爱好者和修补匠。

基本上……就是所有人。

从 Atlas 到 404–GEN

这个想法可以追溯到创始人 Ben James 和一个名为 Atlas 的项目。

Ben James 受过建筑师训练,但他的思维方式更像是一名系统工程师。他早期的工作专注于塑造虚拟空间:3D 城市、复杂的室内设计、沉浸式景观。他所拥有的创作工具功能强大,但瓶颈在于规模。即使是最优秀的艺术家,产出素材的速度也有限。

2023 年,Ben 推出了 Atlas,一个旨在帮助 EA、Ubisoft 和 Rockstar 等工作室加速资产创作的 Web 2 平台。方法很直接:使用 AI 生成原始素材。AI 可以在过去制作 100 栋建筑的时间内生成 20,000 栋独一无二的建筑 。工作室用它来渲染整座城市。它奏效了。

来自 LinkedIn

但在这些流程中,Ben 注意到了一些奇怪的现象。研究在加速,但进展却显得零散。数十个实验性模型在流传,却 “没有系统来奖励进步或组织前沿。” 创新在各自为政的孤岛中发生。Atlas 对大型团队发挥了作用,但 Ben 开始看到一个更大的机会。

当他发现 Bittensor——一个去中心化 AI 协议时,这一转变变得清晰起来。它允许任何人创建一个专用子网,即用于训练或服务模型的专用网络。Ben 的想法是奖励构建出最佳文本到 3D 生成模型的人 。通过将 404–Gen 设为 Bittensor 子网,他们可以利用去中心化的计算能力和全球 AI 人才库——所有人既竞争又协作,以改进文本到 3D 的生成。

2024 年,Ben 和他的团队将 404–Gen 作为子网 17 推出。他们将 Atlas 背后的核心技术向全世界开放。任何人都可以贡献模型,任何人都可以验证输出。网络会衡量性能,并根据结果分发代币奖励。该协议不关心声誉或品牌,它只关心输出质量。

由 404-Gen 完全生成的水下场景

Ben 现在带领着一支专注的团队 ,由 10 多名在 3D 图形和 AI 领域有深厚背景的研究人员和工程师组成。Atlas 同时继续运营,为企业用户服务,并且获得了 600 万美元的支持的风险投资(凸显了投资者对 AI 驱动的 3D 创作的信心)。

但 404–Gen 是 Ben 的长期布局。它将一家 3D 内容公司重新构想为一个去中心化协议 ,为速度、竞争和规模而构建。

404-Gen 的运作方式:文本提示 → 3D “Splats”

那么……当你在 404–Gen 中输入提示时,究竟会发生什么呢?

假设你输入: 一棵长着苔藓根的老橡树 。在幕后,一群 AI 模型正争分夺秒地将那棵树呈现出来。这些模型经过海量 3D 几何、纹理和场景数据集的训练。它们的任务是合成一个与你描述相匹配的形状,而且要快速完成。

404–Gen 并不依赖单一模型。它作为一个模型无关的市场运行,在这里多种方法会在每个提示上相互竞争。某个参与者可能会使用神经辐射场,另一个可能依赖扩散生成的点云,还有人可能会将文本输入到网格生成器中。

这种多模型的方法让网络始终保持在前沿。如果有新的学术突破出现,404–Gen 社区中的某个人就可以将其集成并参与竞争。

要理解这为什么重要,有助于先拆解一下 3D 内容是如何呈现的。主要有三种方法。

网格(Meshes) 是 3D 图形的传统支柱。物体由多边形表面(通常是三角形)构建,这些表面由艺术家手动塑形,或通过程序化工具生成。网格精确且可直接用于游戏,因为像 Unity 和 Unreal 这样的引擎就是以它们为基础。但它们难以扩展。每一个新形状往往意味着要从零开始。

NeRF(神经辐射场,Neural Radiance Fields) 大约在 2020 年从学术实验室中出现。NeRF 不使用多边形,而是利用神经网络学习场景在不同视角下的外观。它们能够生成令人惊叹、逼真的静态场景渲染(比如将一组照片转换成 3D 飞行浏览)。

然而,它们计算量大且难以实现交互。NeRF 不会生成可直接用于游戏引擎的可用网格。

接着出现了 3D 高斯喷溅

这种技术于 2023 年出现,并迅速改变了游戏规则。在 404–Gen 中,它成为了快速、高质量 3D 生成的默认方法。

喷溅并不是用三角形或体素网格来构建物体,而是将场景表示为由密集的小型半透明椭球体组成的云。每个“喷溅”都包含位置、颜色、大小和不透明度。将它们一起渲染时,它们会融合成平滑的 3D 图像。可以把它想象成空间中的点彩画。

与 NeRF 不同,喷溅可以运行得更接近实时 。而与网格不同,它们不需要繁琐的手动构建。

从用户的角度来看,收益是立竿见影的。输入提示词,等待不到一分钟,就能看到一个具有真实光照和形态的纹理化 3D 对象。它可能还不适合最终导出,但足以用来探索创意、调整方向并持续推进。

这就是核心优势:splats 提供接近 NeRFs 的视觉质量,同时具备如同游戏引擎原生般的性能。它们既快速又富有表现力。

2019–2025 年关键 3D 建模方法研究论文的季度趋势

像 Unity 和 Unreal 这样的游戏引擎仍然将 splats 视为外来元素。它们需要插件或转换工具才能顺畅运行。404–Gen 团队正在构建一个“splat 转 mesh”转换器来弥合这一差距。在此之前,splats 最适合用于原型设计。

即使资产尚未最终完成,这个过程也是一种胜利。概念艺术家、游戏开发者和世界构建者能够获得一个更紧密、更低成本且更有趣的反馈循环。

锦标赛引擎

404–Gen 不仅仅是生成 3D 模型。它还会运行一场锦标赛。

每个提示词(“中世纪木桶”、“科幻爆能枪”、“盆景树”)都会在矿工之间发起一场比赛。每个矿工都是一个运行文本到 3D 模型的节点。性能通过实时 Glicko2 排名系统进行跟踪,类似于国际象棋的 Elo 评分系统。

404-gen 矿工仪表板

强大的矿工在排行榜上攀升并赢得更多奖励(因为奖励取决于 Glicko2 分数 × 提交结果 )。弱小的矿工则会下滑并获得更少奖励。每个请求都是一场比赛,包含状态、代币以及证明某个模型属于该网络的凭证。

当矿工提交结果时,会生成资产——通常是一个包含高斯点云的 .ply 文件,每个点云都包含位置、颜色、大小和不透明度信息。Unity 和 Blender 的插件可以即时渲染结果。大约一分钟内,木桶就会出现在屏幕上,并带有纹理和光照效果。

用户随后可以根据需要修改结果。404–Gen 支持“剪切”功能——例如,你可以通过在不喜欢的模型部分周围绘制一个方框或椭球来将其遮罩掉。这样可以在不从头重新生成的情况下,移除不需要的部分,从而获得一定的创作控制权。用户还可以通过调整提示词或风格提示词重新尝试,以微调输出的外观(例如“将它做成低多边形风格的木桶”等)。

这种结构推动了持续的实验。如果 DeepMind 发布了一篇新论文,有人就可以实现它,将其部署到 Subnet 17,并立即在开放竞技场中查看其表现。没有人关心品牌或声誉,只有在直接对比中获胜的成果才能获得奖励。

每个输出同时也是一个基准。验证者检查结果、更新排名,并以固定供应量的子网代币分发奖励。这个循环每天运行数千次,并且数据集会随着每个提示不断增长。

让引擎灵活的原因在于它接受任何方法。一些矿工通过扩散生成三维点云 ,然后将其转换为 splats。其他人则为每个提示即时训练一个 NeRF,使用文本到图像模型作为教师 。现在许多人依赖高斯 splatting 来获得速度和保真度。系统不强制使用单一技术,它会奖励能提供最佳结果的方法。

通过结合这些步骤,404–Gen 通过自我改进的去中心化装配线将文本提示转化为 3D 资产。随着时间推移,网络生成的资产应该会变得更好、更丰富,因为网络会学习哪些模型最适合哪类提示。

换句话说,404–Gen 是一个面向 3D AI 的“挖矿”经济。

分布式 3D 资产生成的工作流程图。来源:404–Gen 白皮书

404–Gen 迄今取得的成就

成立仅一年多,404–Gen 已经交付了实实在在的产品。它推出了一个 Unity 插件,并在 Unity Asset Store 上通过了验证,这是该平台上首个基于区块链的 3D 生成器。它还发布了 Blender 插件、网页应用以及 Discord 机器人,让创作者能够在自己熟悉的工具中使用该系统。

404–Gen 声称其数据集包含 2150 万+ 个 AI 生成的 3D 模型 ,约 40 TB 的内容,全部附带提示词、元数据和贡献者署名。他们已在 Huggingface 上公开发布了一个 迷你子集(20,000 个资源)

在我看来,404–Gen 的数据集是其竞争优势的核心支柱。它推动模型改进、提升用户体验速度,并赋予其竞争对手需要数月甚至数年才能追赶的领先优势。在当今的文本生成 3D 领域,能够获取开放且多样化的数据集非常罕见。对于 404–Gen 来说,这在三个方面提供了真正的价值:训练新架构、支持研究以及交付可扩展的创作者工具。

独立开发者已经使用 404-Gen 构建了完整的游戏场景,很多人此前并没有 3D 经验。事实证明了这一点:404-Gen 降低了门槛,让任何人都能参与 3D 创作。

团队还引入了二维到三维生成 。用户可以输入草图或参考图像,并获得由 AI 生成的三维模型。该功能目前已在代码层面为矿工开放,并将在未来的版本中集成到创作者的工作流程中。

404-Gen 有机会吗?市场定位与竞争对手

多年来,文本生成 3D 一直被视为数字内容的圣杯。谁能打造出快速、易用且可集成的工具,就能为从游戏到 AR/VR 再到虚拟世界的各类资产供应链提供动力。

404–Gen 是最具胆识的竞争者之一。它正处于一个由实验室、初创公司和巨头组成的拥挤赛道中,各自尝试着不同的方式。

大型科技公司与 AI 实验室 多年来一直在进行实验。Google 的 DreamFusion 展示了你可以 使用 NeRF 风格的优化从文本生成 3D 模型,但每个场景通常需要耗费数小时 。NVIDIA 的 Magic3D 在此基础上有所改进,可以更快地生成更高分辨率的网格,但仍未达到实时速度。GET3D 则生成可直接用于后续工作的显式纹理网格。Meta、Adobe 以及其他公司正在构建数据集、授权模型并开发工具。这些努力中的许多仍停留在研究阶段或有限的测试版本。截至目前,能够让创作者直接在 Unity 或 Blender 工作流中实时使用的工具仍然很少。

游戏引擎制造商 可能会彻底改变游戏格局。Unity 已经转向 AI 辅助工具(包括 Muse),并收购了具备 VFX 级别的技术。Unreal 拥有庞大的资产库和强大的图形处理管线。如果 Unity 或 Epic 深度整合文本生成 3D 技术,他们可能会重塑资产获取的方式。但集成、性能以及开放许可仍然是障碍。在这一空档中,404-Gen 目前处于领先地位。

在初创公司中,关注点一直集中在问题的细分领域。Luma AI 让用户可以轻松用手机捕捉真实物体,并将其转换为基于 NeRF 的 3D 扫描。Kaedim 将 2D 图像转换为 3D 模型,并通过人工修饰进行优化。Blockade Labs 专注于从文本提示生成全景天空盒。Lovelace Studios (Anything World) 曾尝试通过语音或文本驱动的生物生成。

这些参与者很有趣,但大多比较局限。到目前为止,还没有谁能像 404–Gen 一样,向用户提供一个广泛的端到端平台——可能的例外是 Luma,它的进展非常迅速。

404–Gen 的优势很简单。它已经上线,可立即使用,并拥有一个正在生成数百万资产的社区。它旨在提供快速响应、多种模型类型的竞争、开放许可,以及在创作者所在的平台进行集成。

在一个充斥着研究论文和有限演示的领域,404–Gen 正在推出人们可以实际使用的工具。

前方的障碍

扩展 404–Gen 并非板上钉钉。最大的障碍是质量 。AI 生成的资产在惊艳与崩坏之间摇摆不定。一个提示可能生成一个完美的中世纪木桶,也可能吐出扭曲的几何形状和漂浮的碎片。早期的图像生成器在人脸上也经历过同样的成长阵痛。三维内容更是将难度成倍增加。

验证过滤器有所帮助,但无法保证不同风格间的一致性。一个逼真的坦克和一条卡通龙需要不同的模型家族。用户最终会期望在这一范围内都能保持可靠性。

第二个挑战是工作流程集成 。Splat 非常适合快速原型设计,但生产流水线需要带有纹理、LOD 和碰撞模型的干净网格。目前,404–Gen 生成的是密集点云——虽然可以快速查看,但并不适用于游戏。一个从 splat 转换为网格的转换器正在开发中,在其成熟之前,手动清理仍然是瓶颈。这个差距为拥有更完善流水线的竞争对手提供了介入的空间。

然后是竞争本身 。如果 Unity 或 Epic 推出原生的文本转 3D 功能,许多开发者会出于便利而默认使用它。大型科技公司拥有用户基础、分发渠道和资本,一旦决定时机成熟,就能迅速占领市场。404–Gen 最好的防御是速度、开放性以及其社区的集体力量。这些是中心化竞争对手难以轻易复制的优势。

最终,生成式 AI 仍处于灰色地带。404–Gen 采取了谨慎的路线:开源模型、已授权的数据、自有且来源可追溯的数据集,以及为每个输出提供元数据。这为溯源和合规性提供了保障。然而,没有任何系统是完美的。如果受版权保护的材料进入训练数据,输出可能会重复受保护的作品。随着标准的不断演变,保持警惕将至关重要。

代币与赌注

SN17 代币价格(Taostats.io)

404-Gen 已经有一个上线的可交易代币 ,属于 Bittensor 的 dTAO 经济体系。截至撰写时,该代币价格为 4.36 美元,市值为 1100 万美元 ,完全稀释估值为 9100 万美元 。按市值计算,它在 Bittensor 子网中排名第 18 位。

我首先承认,目前的价格走势图并不能带来太大信心。动能较弱,这对于一个持续通胀且需求有限的代币来说很常见。这看起来像是市场的冷漠。

然而,我常常认为最有趣的机会就隐藏在这种地方:当投资者将目光投向别处时,协议仍在持续交付。关键在于时间周期。任何买入的人都必须将其视为一种风险投资式的押注,而不是一次短线交易。它获得了 Unsupervised Capital 的支持,这增加了一些可信度。

该估值基于真实资产:庞大的开放式 3D 数据集、经过验证的 Unity 和 Blender 插件,以及已经在构建场景的创作者。团队正以稳定的速度交付可用工具。缺失的是一个清晰的盈利模式。

404–Gen 还未开启盈利模式。我认为他们会采取的策略是:先免费提供生成服务以建立社区,融入创作者的工作流程,等到网络效应让切换成本变高时,再推出付费等级。

Midjourney 的惊人收入增长。来源:GetLatka

Midjourney 证明了这种商业模式的可行性,从开始收费的第一年就实现了从零到 5000 万美元的收入,预计到 2025 年底将达到惊人的 5 亿美元。

(与此同时,我只是用 Midjourney 来生成二次元美少女……)

404–Gen 有机会做得更大。3D 资产的计算成本更高,专业用途更多,且相比平面图像用户更愿意付费。再叠加与矿工的收入分成,就能形成一个既推动采用又能持续产生现金流的系统。

作为估值对比(不是完全对等,更像苹果对梨 ):Luma AI 借助视频生成和世界模型的叙事,正以约 800 万美元的收入追求 32 亿美元的融资轮。Kaedim 将 2D 艺术转化为 3D 模型,据报道其 年收入 达到 950 万美元。两者都是 Web2 初创公司。

公司

估值 / 完全稀释估值(FDV)

收入(预估)

重点

404–Gen(Bittensor)

1100 万美元市值 / 9100 万美元完全稀释估值

不适用

去中心化文本转 3D,Unity/Blender 插件

Luma AI

约 32 亿美元(融资洽谈中)

约 800 万美元 ARR

生成式视频,多模态“世界模型”

Kaedim

约 5000 万美元

约 950 万美元 年经常性收入(ARR)

2D 转 3D 转换并配有人为质量控制

Luma 展示了风险投资市场如何为“媒体创作的 AI”下注定价,这表明在生成式内容领域,投资者会为一个强有力的叙事推高出价。Kaedim 展示了在这一领域中如何能够相当迅速地建立可观的收入来源。404–Gen 可能是这里的“被低估的开放玩法”。

发展轨迹很重要。 如果采用率提升,如果网格导出功能弥补了工作流程的缺口,如果工作室开始将 404–Gen 视为默认的文本转 3D 流程,那么今天 9000 万美元的 FDV(以及 1100 万美元的市值)在一年内将显得极为保守。 市场似乎在定价中考虑了部分成功,但并未反映全部潜在上行空间。

然而,从原型到生产的跨越并非易事。资产必须从 splats 转换为 meshes,流水线需要打磨,游戏引擎的工作流程也必须具备可靠性。竞争也在逼近。如果 Unity、Epic 或某个大型实验室发布了打磨完善的文本生成 3D 工具,格局可能会迅速改变。

简而言之,这正是你对早期协议的预期:高风险,高回报。

通往 AI 原生虚拟世界之路

在短期内,404–Gen 的任务是精进。核心验证(按需从文本生成 3D)已经实现。现在的重点转向打磨:更简洁的网页应用、可搜索访问 2100 万资产的资源库、更多适配 Unity 和 Blender 的插件,以及让输出直接可用于游戏的 mesh 导出。在这里可以期待快速迭代,同时引入去中心化存储,让资产可以通过点对点获取,而不是依赖中心化服务器。

中期前景有所不同。404–Gen 不再只生成单个对象,而是希望推出整套工具包

想象一个完整的中世纪 RPG 素材包:城堡、武器、巨龙和地形,随时可以嵌入原型中。或者一个霓虹闪烁的赛博朋克套装,用于构建一座新城市。主题化的素材包能减少开发者的摩擦,而完全基于 404–Gen 资产的社区游戏创作活动,可以展示该平台的潜力。

更长远的愿景更加激进: 实时生成的 AI 原生世界 。你描述一个位于热带岛屿、带有古代遗迹的生存游戏 。AI 会即时生成地形、来自 404–Gen 的物体、角色、对话、音效,甚至音乐,并在需要时从其他 Bittensor 子网中调用资源。听起来雄心勃勃,但 AI 游戏的早期原型表明,这并非遥不可及。在这种设想中,404–Gen 不再只是一个工具,而是虚拟世界更大型 AI 操作系统的 3D 骨干。

要想取胜,404–Gen 必须依靠其与众不同之处: 开放性、去中心化和速度。 未来几年将决定它能否从令人印象深刻的演示演变为不可或缺的基础设施。

关键指标关注点:

  • 用户增长与参与度 – 是否有更多创作者和矿工加入,资产生成量是否在逐月增长?

  • 产出质量 – 模型的改进是否足以支持现实世界的应用?

  • 合作伙伴关系 – 404–Gen 是否与工作室和工具开发者建立了更深层次的联系?

  • 代币健康 – SN17 是否能长期保持价值并激励矿工?

结论

404–Gen 很容易被忽视。许多人仍然对 Bittensor 及其子网持有负面看法,认为它们大多是空洞的噱头。

但 404 已经实现了其他人仅停留在承诺阶段的事情:一个实时运行的去中心化系统,可以大规模地将语言转化为 3D 对象。数据集庞大,工具已经可用,激励循环不断推动模型向前发展。

风险显而易见。输出质量、工作流程集成,以及来自巨头的竞争,都可能让其发展停滞。回报则难以忽视。如果它成功,世界构建将从数小时的建模转变为几分钟的对话。

这就是赌注:任何有想法和键盘的人(是的,就是你和我)都可以构建完整的 3D 世界。

致敬,

Teng Yan & Avu

这是来自 Chain of Thought 的独立报告。我们在撰写本文时未收到来自 404-Gen 的任何付款或赞助。

本文仅用于教育目的,不构成财务建议。本文并非对购买或出售资产或做出财务决策的认可。进行投资前,请务必自行研究并谨慎行事。

了解 RecodeX 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读