15000名黑客围攻Claude和GPT-5:Gray Swan AI融资4000万美元,估值2亿
当你下次使用Claude、GPT-5或Gemini时,你大概不会想到——在模型发布之前,可能已经有数千名黑客花了数周时间试图让它说出不该说的话、做出不该做的事。这背后的推手之一,就是Gray Swan AI。
这家成立于2023年的AI安全初创公司刚刚完成了4000万美元的A轮融资,估值达到2亿美元。更引人注目的是,它与每一家主要的前沿AI实验室都有合作关系——OpenAI、Anthropic、Google DeepMind无一例外。
学术基因:两位CMU教授的创业之路
Gray Swan AI的两位联合创始人Matt Fredrikson和Zico Kolter都是卡内基梅隆大学(CMU)的计算机科学教授。CMU在AI安全和对抗性机器学习领域拥有全球领先的研究实力,而这两位教授正是该领域的核心研究者。
Zico Kolter尤其值得关注。他不仅是CMU的终身教授,还曾在对抗性攻击和机器学习鲁棒性方面发表了大量开创性论文。这种深厚的学术积累,使得Gray Swan AI从一开始就不是一家「PPT公司」,而是拥有真正技术壁垒的团队。
核心产品:Gray Swan Arena——大模型的「竞技场」
Gray Swan AI的核心产品是一个名为「Gray Swan Arena」的红队测试平台。与传统的安全测试不同,Gray Swan Arena采用了众包模式,汇集了超过15000名安全研究人员和黑客,通过竞赛和激励机制来发现AI模型的漏洞。
这种模式的精妙之处在于:没有任何一个内部安全团队能够穷举所有可能的攻击路径,但15000名各怀技能的黑客可以。他们从不同的角度、不同的文化背景、不同的专业领域出发,对模型进行「压力测试」,发现那些工程师们可能永远想不到的脆弱点。
据知情人士透露,Gray Swan的红队测试曾在多款主流大模型发布前发现了严重的安全漏洞,包括绕过安全对齐的方法、隐蔽的提示注入攻击路径,以及可能被用于生成有害内容的边缘案例。
从To Lab到To Enterprise:第二条增长曲线
目前,Gray Swan AI的主要客户是AI实验室——它帮助OpenAI、Anthropic等公司在模型发布前进行安全评估。但公司正在积极拓展第二条业务线:为构建AI Agent的企业客户提供安全工具。
这个转型逻辑很清晰。随着越来越多的企业开始基于GPT-4、Claude等模型构建自己的AI Agent和应用,安全测试的需求正从AI实验室向下游企业扩散。Gray Swan计划将其在大模型红队测试中积累的方法论和工具,打包成企业级产品,帮助银行、医疗机构、政府部门等在部署AI应用前进行安全评估。
2亿美元估值的合理性
4000万美元融资、2亿美元估值,对应的投后市销率取决于Gray Swan当前的收入水平。考虑到AI安全服务的单价通常不低(单次大模型评估的费用可达数十万美元),如果Gray Swan已经与所有主要AI实验室建立了稳定的合作关系,这个估值是有其合理性的。
但风险也很明显。AI实验室自身正在大力投入安全团队建设——OpenAI的Safety团队已经扩展到数百人,Anthropic更是以安全为核心卖点。如果这些客户的内部能力足够强大,外部红队服务的需求可能会被压缩。Gray Swan需要证明的是:外部视角的价值是不可替代的,就像即使企业有内部安全团队,仍然需要第三方渗透测试一样。
一个关键问题
值得追问的是:当你的业务模式建立在「黑入AI模型」之上时,你的商业模式的可持续性取决于AI模型永远存在漏洞。如果未来AI模型变得足够安全,Gray Swan的核心业务是否会萎缩?
从历史来看,网络安全行业的经验告诉我们:防御永远落后于攻击。只要AI模型的能力在增长,新的安全风险就会持续涌现。从这个角度看,Gray Swan AI押注的不是某个特定的漏洞,而是AI能力增长所必然伴随的安全需求。这可能是一个长期成立的赛道。