15000名黑客围攻Claude和GPT-5：Gray Swan AI融资4000万美元，估值2亿

项目速览

项目名称 Gray Swan AI

融资轮次 Series A

融资金额 $40M

当你下次使用Claude、GPT-5或Gemini时，你大概不会想到——在模型发布之前，可能已经有数千名黑客花了数周时间试图让它说出不该说的话、做出不该做的事。这背后的推手之一，就是Gray Swan AI。

这家成立于2023年的AI安全初创公司刚刚完成了4000万美元的A轮融资，估值达到2亿美元。更引人注目的是，它与每一家主要的前沿AI实验室都有合作关系——OpenAI、Anthropic、Google DeepMind无一例外。

学术基因：两位CMU教授的创业之路

Gray Swan AI的两位联合创始人Matt Fredrikson和Zico Kolter都是卡内基梅隆大学（CMU）的计算机科学教授。CMU在AI安全和对抗性机器学习领域拥有全球领先的研究实力，而这两位教授正是该领域的核心研究者。

Zico Kolter尤其值得关注。他不仅是CMU的终身教授，还曾在对抗性攻击和机器学习鲁棒性方面发表了大量开创性论文。这种深厚的学术积累，使得Gray Swan AI从一开始就不是一家「PPT公司」，而是拥有真正技术壁垒的团队。

核心产品：Gray Swan Arena——大模型的「竞技场」

Gray Swan AI的核心产品是一个名为「Gray Swan Arena」的红队测试平台。与传统的安全测试不同，Gray Swan Arena采用了众包模式，汇集了超过15000名安全研究人员和黑客，通过竞赛和激励机制来发现AI模型的漏洞。

这种模式的精妙之处在于：没有任何一个内部安全团队能够穷举所有可能的攻击路径，但15000名各怀技能的黑客可以。他们从不同的角度、不同的文化背景、不同的专业领域出发，对模型进行「压力测试」，发现那些工程师们可能永远想不到的脆弱点。

据知情人士透露，Gray Swan的红队测试曾在多款主流大模型发布前发现了严重的安全漏洞，包括绕过安全对齐的方法、隐蔽的提示注入攻击路径，以及可能被用于生成有害内容的边缘案例。

从To Lab到To Enterprise：第二条增长曲线

目前，Gray Swan AI的主要客户是AI实验室——它帮助OpenAI、Anthropic等公司在模型发布前进行安全评估。但公司正在积极拓展第二条业务线：为构建AI Agent的企业客户提供安全工具。

这个转型逻辑很清晰。随着越来越多的企业开始基于GPT-4、Claude等模型构建自己的AI Agent和应用，安全测试的需求正从AI实验室向下游企业扩散。Gray Swan计划将其在大模型红队测试中积累的方法论和工具，打包成企业级产品，帮助银行、医疗机构、政府部门等在部署AI应用前进行安全评估。

2亿美元估值的合理性

4000万美元融资、2亿美元估值，对应的投后市销率取决于Gray Swan当前的收入水平。考虑到AI安全服务的单价通常不低（单次大模型评估的费用可达数十万美元），如果Gray Swan已经与所有主要AI实验室建立了稳定的合作关系，这个估值是有其合理性的。

但风险也很明显。AI实验室自身正在大力投入安全团队建设——OpenAI的Safety团队已经扩展到数百人，Anthropic更是以安全为核心卖点。如果这些客户的内部能力足够强大，外部红队服务的需求可能会被压缩。Gray Swan需要证明的是：外部视角的价值是不可替代的，就像即使企业有内部安全团队，仍然需要第三方渗透测试一样。