原创报道
2026.06.25 01:09 约 5 分钟 AI人工智能 1.5万 阅读

Coval完成2800万美元A轮融资:当每天有数百万次语音对话由AI发起,谁来为AI Agent进行“模拟考试”?

项目速览
项目名称 Coval
融资轮次 A 轮 (Series A)
融资金额 2800 万美元
投资方 Norwest, Base10 Partners, Twilio Ventures, Y Combinator
官网 coval.ai
RECODEX PARTNERSHIP
你的项目,下一篇值得报道

语音 AI 评估与仿真平台服务商 Coval 日前宣布,已成功完成了由 Norwest 领投的 2800 万美元 A 轮融资,Base10 Partners、Twilio Ventures 以及著名孵化器 Y Combinator 参投。本轮融资使这家成立于 2024 年的初创公司在不到两年的时间里,累计筹资总额达到了 3100 万美元。新资金将主要用于扩展其核心的“多模态仿真与概率评估引擎”,并加速在大型企业级客户中的部署。

公司名称 Coval
创始人/CEO Brooke Hopkins (CEO & Founder)
融资轮次 A 轮 (Series A)
融资金额 2800 万美元
累计融资 3100 万美元 (自 2024 年)
领投方 Norwest
跟投方 Base10 Partners, Twilio Ventures, Y Combinator
官网 Coval

语音 AI 的“最后一公里”:如何测试一个会说谎和幻觉的 Agent?

在企业级客服场景中,部署一个 AI 语音智能体(Voice Agent)的风险远比部署一个文字聊天机器人高得多。文字聊天的错误可以通过后期的修饰或人工审核拦截,但在实时的语音电话中,AI 说的每一句话都将直接传达给客户。如果 AI Agent 在电话中胡言乱语(幻觉)、泄露隐私、或者给出了错误的医疗/金融建议,对企业造成的法律和品牌灾难将是不可承受的。

然而,传统的软件测试方法论(如单元测试、端到端自动化测试)在面对具有“随机性”和“概率性”的大语言模型(LLM)时彻底失效了。你无法通过预设的输入和预期的输出来断言一个智能体的行为——在第一万次测试时,它可能会因为温度参数的微小波动,给出一个完全出乎意料的危险回答。

CEO Brooke Hopkins 创立 Coval 的核心动因正是为了解决这个痛点:如果我们要让企业敢于将成千上万个电话交给 AI 接听,就必须有一个独立的、高精度的“模拟考试”平台,在上线前对 AI 智能体进行成千上万次破坏性压力测试。

概率评估与全场景仿真:Coval 的三大技术支柱

Coval 提供了一套集“仿真(Simulation)”、“可观测性(Observability)”和“标注(Labelling)”于一体的 SaaS 评估平台。其核心系统由三个技术支柱构成:

  • 多代理仿真器(Multi-Agent Simulator):在虚拟沙盒中模拟真实的人类电话。Coval 的系统会扮演“愤怒的客户”、“急躁的患者”或“试图套取商业机密的攻击者”,给受测的 AI Agent 打电话,测试其在各种极端情绪和边缘情况(Corner Cases)下的反应与边界防守能力。
  • 概率评估引擎(Probabilistic Evaluation Engine):由于 AI 智能体的每次表现都不同,Coval 通过在仿真环境中运行数百万次电话交互,采用概率统计学模型对 Agent 的合规率、问题解决率、幻觉率进行量化打分,输出确切的风险评级报告。
  • 闭环标注与标注(Observability & Labelling Loop):在 Agent 上线后,Coval 能够实时监控真实的通话流量,通过语义级分析捕捉到客户的异常停顿、不满情绪或 AI 的答非所问,并自动提取出问题片段,反馈给开发团队进行微调(Fine-tuning)。

通过这种端到端的自动化评估,Coval 将原本需要几周时间、依赖人工听录音的“AI 质量检测”工作缩短到了几分钟,且准确率和覆盖率提升了数个量级。

从 Zoom 到 60+ 巨头客户:Coval 正在定义语音 AI 的合规标准

虽然成立仅两年,Coval 已经在市场上展现了强劲的虹吸效应。目前,视频会议及企业通信巨头 Zoom 已经将 Coval 深度集成到了其 Zoom Contact Center 服务中,用于对其官方部署的语音 AI 进行持续的质量审计与发布前测试。

除了 Zoom 之外,Coval 还服务了超过 60 家大型企业客户,涵盖医疗健康、金融理财及跨境电商等对安全合规要求极高的领域。对于这些企业而言,Coval 的存在相当于给他们的 AI 资产上了一份“技术保险”。

Norwest 合伙人指出:“当生成式 AI 逐渐从‘副驾驶(Copilot)’走向‘独立代理(Agent)’时,评估与测试市场正在爆发一场海啸般的范式转移。谁能控制评估权,谁就将掌握企业级 AI 部署的信任闸门。Coval 以其独特的语音声学与语义双重评估框架,正在成为事实上的行业合规标准。”

RecodeX 极客视点:每一个淘金热的时代,赚到钱的永远是卖铲子的人。在当前的“AI 智能体大战”中,无数的公司在拼命构建更好、更聪明的 AI 客服,但极少有人意识到“如何证明它足够安全”才是一笔更稳健的生意。Coval 的聪明之处在于,它没有加入造智能体的红海,而是站在智能体背后充当“考官”。当 AI 智能体开始接管人类社会的关键工作(如银行贷款审核、医生预约)时,这套“模拟考试”和“概率审计”的基建价值将被放大到极致:没有考官的签字,AI 将寸步难行。

RECODEX PARTNERSHIP
你的项目,下一篇值得报道
RecodeX 为 AI×Web3 早期项目提供从深度报道到融资撮合的全链路服务。三档方案,按阶段匹配。