DeepL 正式进军语音翻译:文本翻译之王能否在实时语音赛道再造护城河?
DeepL 做了一件所有人预料之中、但时机耐人寻味的事:这家以文本翻译闻名的德国公司,今天正式发布了语音对语音翻译产品线,覆盖会议、移动端对话和团队协作三大场景,同时开放了面向第三方开发者的 API。
这家公司目前估值约 20 亿美元,累计融资超过 4 亿美元,投资方包括 Index Ventures、ICONIQ Growth 和 Atomico 等。在文本翻译领域,DeepL 已经建立了极强的品牌认知——很多用户甚至认为它在翻译质量上优于 Google Translate。但语音翻译是一个完全不同的竞技场,DeepL 需要证明的不只是「翻译得准」,更是「翻译得快」和「体验足够无缝」。
为什么是现在:文本翻译的天花板隐约可见
CEO Jarek Kutylowski 在接受 TechCrunch 采访时说了一句很诚实的话:「在文本翻译和文档翻译上,我们已经走得很远了。但我们认为,市场上还没有一个足够好的实时语音翻译产品。」
这话有两层意思。第一,文本翻译这门生意,DeepL 已经做到了相当成熟的阶段,继续靠文本翻译拉动增长,空间越来越窄。第二,语音翻译确实是一个真实的未满足需求——跨国企业的会议、客服中心的多语言支持、制造业一线工人的跨语言协作,这些场景每天都在发生,但现有方案要么延迟太高,要么翻译质量不够用。
更直白地说,DeepL 选择此时进入语音赛道,可能还有一个更现实的考量:市场上已经出现了一批专注语音翻译的创业公司,如果 DeepL 继续只做文本,这些公司可能会从语音端反向蚕食它的企业客户。
产品落地:先做 Zoom 和 Teams 插件,再做端到端模型
DeepL 目前发布的语音翻译产品包括三个层面:
第一,会议场景。DeepL 正在为 Zoom 和 Microsoft Teams 开发插件,参会者可以在别人用母语发言时,实时听到翻译后的语音,或者在屏幕上看到实时翻译字幕。这个功能目前处于早期测试阶段,企业需要申请加入等候名单。
第二,移动和 Web 对话。适用于面对面或远程的一对一沟通场景。
第三,团队协作。针对培训、研讨会等多人场景,参与者可以通过扫描二维码直接加入翻译频道。
此外,DeepL 还开放了 API,允许第三方开发者基于其语音翻译技术构建定制化应用——Kutylowski 明确提到客服中心是一个重点用例。系统还支持学习行业术语、公司名称和个人姓名等自定义词汇。
技术路径的诚实与局限
值得注意的是,DeepL 在技术路径上选择了一种务实但也有些保守的方案:当前系统并非端到端的语音翻译,而是走「语音→文本→翻译→语音」的三步流水线。DeepL 的论点是,自己在文本翻译环节有多年积累,因此在翻译质量上有优势。
但这种架构的代价是延迟——每多一步转换,就多一层延迟。在实时会议场景中,0.5 秒和 2 秒的差距可能决定了用户是觉得「还不错」还是「完全没法用」。DeepL 表示,未来目标是开发端到端的语音翻译模型,跳过中间的文本步骤。但「未来」是什么时候,公司没有给出时间表。
竞争对手并非善茬
DeepL 进入语音翻译赛道时,面前已经站着几个值得认真对待的对手:
Sanas 去年从 Quadrille Capital 和 Teleperformance 融了 6500 万美元,专注用 AI 实时修改说话者的口音——主要服务呼叫中心场景。它解决的不是语言翻译问题,而是口音歧视问题,但客户群体高度重叠。
Palabra 则获得了 Reddit 联合创始人 Alexis Ohanian 旗下 Seven Seven Six 的投资,正在构建一个不仅翻译语义、还能保留说话者原声的实时翻译引擎——这让它与 DeepL 形成最直接的竞争关系。
迪拜的 Camb.AI 则侧重媒体和娱乐领域的视频配音与本地化,与 AWS 合作,走的是内容产业的路线。
换句话说,语音翻译赛道不是一个等着 DeepL 来收割的空白市场,而是一个已经有专业选手在不同切入角度深耕的竞技场。
DeepL 的真正赌注:品牌信任能否从文本迁移到语音
DeepL 进军语音翻译的底层逻辑,其实不难理解。它在文本翻译领域积累的品牌信任和企业客户关系,是它最大的资产。如果能把这种信任成功迁移到语音领域,DeepL 就能从一个「翻译引擎」升级为企业跨语言沟通的全栈基础设施——这显然是一个更大的故事,也与市场传闻中 DeepL 可能以 50 亿美元估值赴美 IPO 的叙事高度吻合。
但风险同样明确。语音翻译对延迟、自然度和情境理解的要求远高于文本翻译。DeepL 多年积累的文本翻译模型优势,在端到端语音模型的竞争中并不一定能直接转化为护城河。更关键的是,当 Google、Microsoft 和 Meta 这样的巨头也在积极推进多语言语音 AI 模型时,DeepL 作为独立公司的窗口期并不宽裕。
Kutylowski 说,AI 正在重新想象客户服务的未来形态,翻译层帮助企业在合格员工稀缺且昂贵的语言市场提供支持。这话没错,但问题是:这个翻译层最终会由谁来提供?DeepL 需要在巨头们完全发力之前,用产品质量和企业客户锁定来回答这个问题。