ComfyUI 完成 3000 万美元融资,估值 5 亿美元:用节点式工作流对抗 AI 垃圾内容,让创作者掌控生成过程的每一步
2023年初,当Stable Diffusion等扩散模型刚刚引爆AI图像生成浪潮时,大多数用户还在用简陋的文本提示词与“抽卡”式的随机生成搏斗。两年后,一个名为ComfyUI的开源项目,凭借其独特的节点式工作流,不仅积累了400万用户,还刚刚拿到一笔3000万美元的B轮融资,估值飙升至5亿美元。这家由Craft Ventures领投、Pace Capital和Chemistry跟投的初创公司,正在将AI生成从“黑箱操作”推向“工程化控制”——但问题是,当所有人都能用一句话生成图像时,谁还需要一个工程师式的工具?
它的客户名单很短,但电费账单很长
ComfyUI的核心卖点听起来有些反直觉:它让AI生成变得更复杂。与Midjourney或ChatGPT那种“输入提示词-等待结果”的极简界面不同,ComfyUI提供了一个可视化的节点编辑器。创作者需要像搭建乐高一样,将“文本编码器”、“采样器”、“图像解码器”等模块手动连接起来,才能完成一次生成。CEO Yoland Yan直言不讳地批评了主流方案:“典型的提示词方案只能达到60-80%的效果。要改变剩下的20%,你得像玩老虎机一样反复尝试。”在ComfyUI的世界里,没有运气,只有参数。
这种“反直觉”的设计,恰恰吸引了最挑剔的用户。ComfyUI的400万用户中,活跃着一批视觉特效师、动画师和工业设计师。在好莱坞的后期制作工作室和硅谷的广告公司里,“ComfyUI Artist”或“ComfyUI Engineer”已经成为一个真实的职位头衔。这些专业人士需要精确控制每一帧的生成过程,而不是让AI随机发挥。ComfyUI的节点式界面让他们可以像调试代码一样调试图像——调整某个节点的参数,观察输出变化,然后反复迭代,直到结果完美。
但这也意味着ComfyUI的用户门槛极高。普通用户可能在打开界面的第一分钟就被密密麻麻的节点和连线劝退。Yan也承认,ComfyUI的目标用户不是“用AI生成头像发朋友圈”的普通人,而是那些“愿意为1%的质量提升花费数小时”的专业创作者。这种定位让ComfyUI在市场规模上天然受限——它的客户名单可能很短,但每个客户的电费账单(和GPU租赁成本)都很长。
真正的销售挑战:让客户为“潜力”付钱
ComfyUI的商业化路径目前仍是一个悬而未决的问题。这家公司此前在2024年底完成了1900万美元的A轮融资,投资方包括Chemistry Ventures、Cursor Capital和Vercel创始人Guillermo Rauch。加上最新的3000万美元B轮,ComfyUI的总融资额已接近5000万美元。但值得注意的是,ComfyUI的核心产品——那个开源的节点式工作流——目前仍然是免费的。公司尚未公布任何明确的付费计划或企业版定价。
Yan的愿景是让ComfyUI成为“AI生成领域的GitHub”——一个创作者协作、共享和迭代工作流的平台。但GitHub的商业模式建立在代码托管和企业服务之上,而ComfyUI的工作流本质上是一组节点配置,其复杂度和价值远低于代码。更现实的问题是:当竞争对手如Weavy(已被Figma收购)正在将类似功能集成到设计工具中时,ComfyUI作为一个独立平台,如何说服用户为“工作流管理”付费?
目前ComfyUI最接近商业化的尝试是“ComfyUI Cloud”——一个托管式的GPU计算服务,用户可以在云端运行自己的工作流。但这本质上是一个算力转售生意,利润率极低,且面临RunPod、Replicate等成熟平台的竞争。Yan的另一个想法是“工作流市场”,让创作者出售自己设计的节点配置。但一个节点配置能卖多少钱?10美元?100美元?这能否支撑起5亿美元的估值?市场显然在赌ComfyUI能成为“AI生成时代的Photoshop”——但Photoshop的商业模式是卖软件授权,而ComfyUI至今连一个付费按钮都没有。
当AI“垃圾内容”泛滥,精准控制才是解药?
Yan在采访中提出了一个有趣的观点:“在AI垃圾内容(AI slop)即将泛滥的世界里,ComfyUI这种‘人在回路中’的方法最终会赢得大多数眼球。”这个判断基于一个假设:随着AI生成内容的爆发,用户将越来越难以区分优质内容与低质内容,而那些经过人工精细调校的作品将脱颖而出。
这个逻辑在专业领域显然是成立的。一部好莱坞大片中的特效镜头,需要数百帧的精确控制,AI只能作为辅助工具而非替代品。但在消费级市场,情况可能恰恰相反。当Instagram和TikTok上充斥着AI生成的短视频时,用户真的在乎这些内容是用Midjourney一键生成的,还是用ComfyUI花了三小时调出来的吗?大多数情况下,用户只关心内容是否有趣或好看,而不是背后的制作工艺。
ComfyUI的真正机会可能在于“垂直化”。例如,为广告公司提供预置的工作流模板,让设计师可以快速生成符合品牌规范的视觉物料;或者为游戏开发者提供角色生成管线,确保每个NPC的形象风格一致。这些场景需要高度的可重复性和可控性,正是ComfyUI的强项。但这也意味着ComfyUI需要从“通用工具”转型为“行业解决方案”,而这需要大量的行业知识积累和定制化服务——这对于一家只有几十人的初创公司来说,挑战巨大。
5亿美元的估值,赌的是“AI工程化”的未来
5亿美元的估值,对于一家成立不到三年、尚未证明商业化的开源工具来说,显然是一个高风险赌注。Craft Ventures等投资方的逻辑可能在于:AI生成正在从“实验”走向“生产”,而生产环境需要的是可控性、可重复性和可扩展性——这正是ComfyUI提供的价值。当Midjourney和ChatGPT在消费级市场跑马圈地时,ComfyUI在专业市场悄然建立了一个护城河:用户生成的工作流本身就是一种资产,迁移成本极高。
但ComfyUI面临的威胁同样真实。首先是技术替代:如果Midjourney或Adobe Firefly在下一代产品中加入了类似节点式控制的功能,ComfyUI的差异化优势将迅速消失。其次是开源社区的背叛:ComfyUI本身是开源项目,虽然公司拥有商标和核心代码控制权,但社区可以随时fork出一个分支,推出功能更强大的替代品。最后是人才流失:AI领域的顶级工程师薪资高昂,ComfyUI的创始人Yoland Yan需要证明自己有能力吸引和留住顶尖人才,才能支撑起5亿美元的估值。
ComfyUI的故事,本质上是一个关于“控制权”的故事。在一个AI越来越像黑箱的时代,它选择把引擎盖打开,让用户自己动手修理。这听起来很酷,但也很危险——大多数人并不想修理引擎,他们只想开车。ComfyUI能否说服足够多的“司机”成为“机械师”,将决定这家公司是成为下一个Figma,还是下一个被收购后默默无闻的Weavy。至少目前,Yan的赌注是:在AI垃圾内容泛滥的世界里,那些愿意花时间调参的人,最终会赢得一切。而5亿美元的估值,就是市场为这个赌注开出的价码。