介绍 Exa Fast
今天我们推出了 Exa Fast —— 全球最快的搜索 API。Exa Fast 是 Exa 搜索的精简版本,p50 延迟低于 425 毫秒。
我们将 Exa 与 Brave 和 Google Serp(抓取 Google 的工具)进行了比较。Exa Fast 的速度快了 30% 以上。其他所有搜索 API 提供商在底层都封装了这些工具之一,因此延迟更高,所以未被纳入图表。
我们在 us-west-1(加利福尼亚北部)数据中心对数千个随机查询对所有提供商进行了基准测试。例如,Exa 的网络延迟大约为 50 毫秒。
为什么搜索 API 的速度很重要
Exa 专为 AI 系统进行网页搜索而构建。延迟对人类来说很重要,但对 AI 来说更为重要。
快速且基于网页的响应 :搜索如今常常集成到 LLM 调用中,用于获取新闻或精确知识。想想 SearchGPT 或 Perplexity 的摘要。不幸的是,搜索 + LLM 调用对人类来说往往慢得令人烦躁。快速搜索至关重要,这样搜索 + LLM 的延迟才能足够快。
Agentic 工作流 :AI 代理会进行大量搜索调用。想想深度研究代理或光标代理。如果一个深度研究代理进行 50 次搜索调用,而每次快 200 毫秒,那就能为用户节省 10 秒时间。
低延迟 AI 产品 :有些 AI 产品对延迟非常敏感。想想 AI 语音助手。对于这些工具来说,每一毫秒都很重要。网页搜索目前是这些工具最大的延迟瓶颈之一,而且随着 LLM 延迟迅速降低,这个问题会变得更严重。
不能只是一个封装器
只有从零开始构建自己的搜索引擎,才能打造世界上最快的搜索 API——也就是说,你不能只是一个封装器。
许多搜索 API 实际上在底层封装了 Google。这意味着在服务器集群中有浏览器接收用户查询,在 Google 中处理,然后返回结果。这需要超过 700 毫秒的 P50,因此任何封装 Google 的搜索 API 至少会有 700 毫秒的 P50。
相比之下,我们从零开始构建了自己的技术。我们抓取网页,训练模型在其上进行搜索,并开发了自己的向量数据库。我们花了数年时间才完成这一切,但现在它正在带来回报。通过掌控技术栈的每一个环节,我们能够独特地掌控自己的搜索命运,因此可以针对延迟等方面进行优化。
搜索的未来
世界正在变化,搜索也需要随之改变。随着世界迈向超高速的自主代理,我们需要能够跟上的搜索能力。
我们正在为未来构建搜索——在这个未来中,代理会进行数十次搜索,每一次 AI 交互都由最佳且最新的世界知识提供支持。
更快的搜索将让这个未来……更快到来。
如何使用 Exa Fast
在 dashboard.exa.ai 进行测试,选择 Search Type → Exa Fast。文档在这里 。
如果你觉得 425 毫秒还不够快,我们同意。来帮我们构建基础设施,让它更快吧,我们正在招聘 🙂