Coval完成2800万美元A轮融资：当每天有数百万次语音对话由AI发起，谁来为AI Agent进行“模拟考试”？

项目速览

项目名称 Coval

融资轮次 A 轮 (Series A)

融资金额 2800 万美元

投资方 Norwest, Base10 Partners, Twilio Ventures, Y Combinator

语音 AI 评估与仿真平台服务商 Coval 日前宣布，已成功完成了由 Norwest 领投的 2800 万美元 A 轮融资，Base10 Partners、Twilio Ventures 以及著名孵化器 Y Combinator 参投。本轮融资使这家成立于 2024 年的初创公司在不到两年的时间里，累计筹资总额达到了 3100 万美元。新资金将主要用于扩展其核心的“多模态仿真与概率评估引擎”，并加速在大型企业级客户中的部署。

公司名称	Coval
创始人/CEO	Brooke Hopkins (CEO & Founder)
融资轮次	A 轮 (Series A)
融资金额	2800 万美元
累计融资	3100 万美元 (自 2024 年)
领投方	Norwest
跟投方	Base10 Partners, Twilio Ventures, Y Combinator
官网	Coval

语音 AI 的“最后一公里”：如何测试一个会说谎和幻觉的 Agent？

在企业级客服场景中，部署一个 AI 语音智能体（Voice Agent）的风险远比部署一个文字聊天机器人高得多。文字聊天的错误可以通过后期的修饰或人工审核拦截，但在实时的语音电话中，AI 说的每一句话都将直接传达给客户。如果 AI Agent 在电话中胡言乱语（幻觉）、泄露隐私、或者给出了错误的医疗/金融建议，对企业造成的法律和品牌灾难将是不可承受的。

然而，传统的软件测试方法论（如单元测试、端到端自动化测试）在面对具有“随机性”和“概率性”的大语言模型（LLM）时彻底失效了。你无法通过预设的输入和预期的输出来断言一个智能体的行为——在第一万次测试时，它可能会因为温度参数的微小波动，给出一个完全出乎意料的危险回答。

CEO Brooke Hopkins 创立 Coval 的核心动因正是为了解决这个痛点：如果我们要让企业敢于将成千上万个电话交给 AI 接听，就必须有一个独立的、高精度的“模拟考试”平台，在上线前对 AI 智能体进行成千上万次破坏性压力测试。

概率评估与全场景仿真：Coval 的三大技术支柱

Coval 提供了一套集“仿真（Simulation）”、“可观测性（Observability）”和“标注（Labelling）”于一体的 SaaS 评估平台。其核心系统由三个技术支柱构成：

多代理仿真器（Multi-Agent Simulator）：在虚拟沙盒中模拟真实的人类电话。Coval 的系统会扮演“愤怒的客户”、“急躁的患者”或“试图套取商业机密的攻击者”，给受测的 AI Agent 打电话，测试其在各种极端情绪和边缘情况（Corner Cases）下的反应与边界防守能力。
概率评估引擎（Probabilistic Evaluation Engine）：由于 AI 智能体的每次表现都不同，Coval 通过在仿真环境中运行数百万次电话交互，采用概率统计学模型对 Agent 的合规率、问题解决率、幻觉率进行量化打分，输出确切的风险评级报告。
闭环标注与标注（Observability & Labelling Loop）：在 Agent 上线后，Coval 能够实时监控真实的通话流量，通过语义级分析捕捉到客户的异常停顿、不满情绪或 AI 的答非所问，并自动提取出问题片段，反馈给开发团队进行微调（Fine-tuning）。

通过这种端到端的自动化评估，Coval 将原本需要几周时间、依赖人工听录音的“AI 质量检测”工作缩短到了几分钟，且准确率和覆盖率提升了数个量级。

从 Zoom 到 60+ 巨头客户：Coval 正在定义语音 AI 的合规标准

虽然成立仅两年，Coval 已经在市场上展现了强劲的虹吸效应。目前，视频会议及企业通信巨头 Zoom 已经将 Coval 深度集成到了其 Zoom Contact Center 服务中，用于对其官方部署的语音 AI 进行持续的质量审计与发布前测试。

除了 Zoom 之外，Coval 还服务了超过 60 家大型企业客户，涵盖医疗健康、金融理财及跨境电商等对安全合规要求极高的领域。对于这些企业而言，Coval 的存在相当于给他们的 AI 资产上了一份“技术保险”。

Norwest 合伙人指出：“当生成式 AI 逐渐从‘副驾驶（Copilot）’走向‘独立代理（Agent）’时，评估与测试市场正在爆发一场海啸般的范式转移。谁能控制评估权，谁就将掌握企业级 AI 部署的信任闸门。Coval 以其独特的语音声学与语义双重评估框架，正在成为事实上的行业合规标准。”

RecodeX 极客视点：每一个淘金热的时代，赚到钱的永远是卖铲子的人。在当前的“AI 智能体大战”中，无数的公司在拼命构建更好、更聪明的 AI 客服，但极少有人意识到“如何证明它足够安全”才是一笔更稳健的生意。Coval 的聪明之处在于，它没有加入造智能体的红海，而是站在智能体背后充当“考官”。当 AI 智能体开始接管人类社会的关键工作（如银行贷款审核、医生预约）时，这套“模拟考试”和“概率审计”的基建价值将被放大到极致：没有考官的签字，AI 将寸步难行。