AI Search API 市场深度调研报告

核心发现

AI Search API 已成为 AI 基础设施的核心组件。Exa.ai 凭借自建神经搜索索引、$ 85M B轮融资和 $700M 估值领跑赛道，营收同比增长超过 11 倍。市场持续吸引资本涌入的根本原因在于：AI Agent 市场正以 49.6% 的年复合增长率爆发，而每个 Agent 都需要搜索 API 作为"感知外部世界的眼睛"。这个市场远未饱和，不同技术路线和垂直场景的差异化空间为多个玩家提供了生存土壤。

一、Exa.ai：凭什么杀出重围

从哈佛宿舍到 $700M 估值

Exa 的故事始于 2021 年。两位哈佛大学校友——Will Bryk（计算机科学和物理学双专业）和 Jeffrey Wang（计算机科学和哲学，华人，曾在 Plaid 构建数据基础设施三年）——在宿舍里运行 GPU 集群时萌生了一个想法：搜索引擎不应该只为人类设计，AI 需要一个完全不同的搜索范式。他们以 "Metaphor" 为名创业，后更名为 Exa，寓意从"隐喻式搜索"走向"精确的知识检索"。

公司的融资轨迹清晰地反映了市场对这个方向的认可度在加速提升：2022 年获得 $ 500 万种子轮（Y Combinator 背书），2024 年 7 月由光速创投领投 $1700 万 A 轮（NVIDIA NVentures 参投），2025 年 9 月完成 $ 8500 万 B 轮融资，由传奇 VC Benchmark 领投（合伙人 Peter Fenton 亲自加入董事会，此人曾带领 7 家公司成功 IPO），估值达到 ** $7 亿美元**。累计融资 $1.11 亿。

在营收层面，据 Sacra 估算，Exa 的 ARR 从 2024 年底的约 $ 186 万，到 2025 年 5 月增长至 $500 万，再到 2025 年 9 月达到 $1000 万，同比增长约 1010%（11 倍）。Getlatka 的数据显示 2025 全年营收达到 $1200 万。这种增速在 SaaS 领域极为罕见。

技术路线：从第一性原理重构搜索

Exa 之所以能杀出重围，核心在于它选择了一条极其困难但壁垒极高的技术路线：从零构建自己的搜索索引和神经网络检索系统，而不是像 Serper、SerpAPI 那样抓取 Google 的搜索结果，也不像 Tavily 那样聚合多个数据源。

具体而言，Exa 的技术架构有三个关键支柱。第一是自建索引基础设施。公司从零搭建了网络爬虫系统，存储约 1 EB（艾字节）的网络内容，包含数十亿文档的全球搜索索引。这意味着 Exa 不依赖任何第三方搜索引擎，拥有完整的数据主权和技术控制力。

第二是神经网络原生的检索算法。与传统搜索引擎基于关键词匹配和 PageRank 不同，Exa 使用端到端训练的神经网络来理解查询意图。它的核心创新在于——不依赖经典 Transformer LLM，而是训练了一种独特的模型来"原生理解链接"。类似于 LLM 预测下一个 token，Exa 的系统学会了预测"下一个最相关的链接"，训练数据来自互联网用户分享链接的自然行为。这使得搜索结果在语义层面远优于关键词匹配。

第三是为 AI 而非人类优化。Google 的搜索结果充满广告、SEO 垃圾内容和为人类视觉设计的 HTML 页面。Exa 的结果没有广告干扰，直接返回结构化 JSON，包含查询依赖型高亮（节省 50-75% 的 Token 消耗，提升 RAG 准确率 10%）、相关性评分、完整页面文本。这对 LLM 消费信息的效率是质变性的提升。

此外，Exa 还构建了 7 种专用搜索索引——通用网页、人物（覆盖 10 亿+ LinkedIn 资料，每周更新 5000 万+）、公司（支持按融资阶段、员工数、地理位置筛选）、代码（从 10 亿+ 网页提取代码片段）、论文、新闻和财经报告。这种垂直化索引是 Tavily、Serper 等竞品完全不具备的。

独立基准测试验证的优势

需要指出的是，不同来源的 benchmark 数据因测试方法和数据集差异，结果有所不同。在一家《财富》100 强企业于 2025 年 1 月进行的独立评估中（数据来自 Exa 官方对比页面），Exa 在复杂多跳检索（WebWalker 基准）上得分 81%，Tavily 为 71%；在 MKQA 多语言知识问答中，Exa 得 70% vs Tavily 63%。而 humai.blog 的独立评测则给出了更高的综合准确率数据（Exa 94.9%, Tavily 93.3%），差异源于测试集的难度和覆盖范围不同。核心结论一致：在复杂语义检索场景中，Exa 的优势明显；在简单事实性查找中，各家差距较小。

响应速度方面，Exa 的 P95 延迟为 1.4-1.7 秒，Tavily 为 3.8-4.5 秒；Exa 的极速模式延迟低于 200ms。在 dev.to 社区的 AN Score 评分中（评估 API 对 AI Agent 的适配度），Exa 以 8.7/10 位列第一，Tavily 8.6 紧随其后。

NVIDIA 和 Benchmark 投资的信号

NVIDIA 连续三轮参投 Exa，原因很直接——Exa 的计算密集型架构（拥有 144 个 H200 GPU 和 3456 个 CPU 的研究集群，B 轮后将扩大 5 倍）是 NVIDIA 芯片的重要客户，同时搜索基础设施是 AI 全栈中不可或缺的环节。Benchmark 的 Peter Fenton 打破了该机构通常只投早期的惯例来领投 B 轮，背后是对"AI Agent 搜索基础设施"这一全新品类的战略性押注。用 Fenton 的话说，Exa 正在构建的是"AI 世界的 Google"。

关键客户图谱

Exa 已被数千家公司采用，其中不乏明星客户：Cursor（ARR 约 $ 5 亿的代码编辑器）、Lovable（ARR 约 $2.06 亿的 AI 开发平台）、Vercel v0（ARR 约 $2 亿的 AI 代码生成工具）、Databricks（用于海量训练集查找）。这些客户本身就是 AI 开发工具的头部玩家，形成了强大的背书效应。

必须指出的弱点与风险

客观来看，Exa 也面临几个不容忽视的挑战。其一，定价是竞品的 10-33 倍（$ 5- $10/千次 vs Serper 的 $ 0.30），这意味着在成本敏感的场景（MVP 验证、高并发低价值查询）中完全不适用，市场覆盖面受限。其二，在高度具体的技术查询上，语义搜索可能不如传统关键词搜索准确。例如精确的错误码、特定版本号的 API 文档查找，关键词匹配反而更可靠——这也是为什么 dev.to 评测中提到 Exa 的 highlights 字段"偶尔不准确"。其三，** $700M 估值对应 $ 1000 万 ARR，市销率高达 70 倍**，远高于成熟 SaaS 企业的 10-20 倍水平。这反映了极高的增长预期，但如果增速放缓，估值将面临显著压力。其四，82 人团队创造 $1200 万年营收，人均 ARR 仅 $14.6 万，低于头部 SaaS 企业的 $20-30 万标准，说明商业化效率仍有提升空间。

二、竞争格局：三层市场与多元技术路线

AI Search API 市场在 2024-2026 年间快速分化，形成了清晰的三层格局和三种技术路线。

技术路线一：自建索引（Exa、Brave Search）

这条路线的核心思路是"不依赖任何人，自己建索引"。Exa 用神经网络构建了语义索引；Brave Search 则基于传统爬虫构建了超过 100 亿网页的独立索引（截至 2022 年 5 月），92% 的搜索结果来自自有索引。Brave 的差异化在于隐私——由 Mozilla 前 CEO/CTO Brendan Eich 创立，不追踪用户数据，适合有合规要求的企业场景。自建索引的优势是结果独立可控、精度高，劣势是成本极高、覆盖面可能不如 Google。

技术路线二：SERP 抓取（Serper、SerpAPI、SearchCans）

Serper 等产品通过抓取 Google 的搜索结果页面（SERP），将 HTML 结构解析为 JSON 返回给开发者。这条路线的优点是结果新鲜度等同于 Google、价格极低（Serper 仅 $ 0.30/千次请求，是 Exa 的 1/15 到 1/33），缺点是完全依赖 Google、返回的原始数据需要大量清洗，且在 Google 政策变更时存在风险。SerpAPI 作为老牌玩家定价较高（ $15/千次），而 SearchCans 等新进入者正以更激进的价格（$0.50/千次）蚕食市场。

技术路线三：混合聚合（Tavily、Perplexity Sonar）

Tavily 是这条路线的代表。它并不自建索引，而是聚合 20 多个权威数据源，通过自有 pipeline 清洗数据并输出 LLM-ready 的结构化 JSON。Tavily 于 2024 年 5 月成立，2025 年 8 月完成 $ 2000 万 A 轮融资（Insight Partners 领投），累计融资 $2500 万，估值约 $ 1 亿。其最大护城河不是技术本身，而是生态位——Tavily 是 LangChain 和 LlamaIndex 的官方搜索集成，约 80% 的开发者在构建 RAG 或 Agent 时首先接触到的就是 Tavily。值得注意的是，Tavily 已于 2026 年 2 月 10 日被 Nebius（NASDAQ: NBIS，阿姆斯特丹的 AI 云基础设施公司，市值超 $230 亿）以 $2.75 亿美元收购。这一事件已得到 Nebius 官方新闻稿、Tavily 官方博客和新华社英文版等多个独立来源确认。这意味着 Tavily 从独立玩家转变为 Nebius AI 云平台的搜索层，其市场定位和独立性都将发生变化。

Perplexity Sonar 则是另一种混合方案——它不返回原始搜索结果，而是直接给出由 LLM 合成的带引用答案。其优势是延迟极低（中位数 358ms，业界最快），劣势是 Agent 无法验证合成过程（黑盒），可能出现幻觉。Perplexity 整体估值已达 $ 200 亿，融资超过 $17.2 亿，但其核心定位是 C 端搜索产品而非 B2D 搜索 API。

核心性能与定价对比

产品	准确率	P95 延迟	定价 / 千次	AN Score	技术路线
Exa	81-94.9%*	1.4-1.7s	$ 5- $10	8.7	自建索引
Tavily	71-93.3%*	3.8-4.5s	~$0.80**	8.6	混合聚合
Perplexity Sonar	93.9%	358ms	$5.00	6.8	混合 + LLM
Serper	~93.5%	2.87s	$0.30	8.0	SERP 抓取
Brave Search	~92%	-	中等	7.1	自建索引
YOU.com	93%	-	企业定价	-	混合

注：准确率范围取决于不同 benchmark 的测试方法和难度，较低值来自复杂多跳检索测试，较高值来自综合评测。Tavily 采用信用点制（Pro $29/月起），此处为换算后的等效单价估计。

定价分化极端——成本最低的 Serper（$ 0.30/千次）和最高的 Exa（ $10/千次）之间相差超过 33 倍。这本身就说明了市场中不同产品服务于不同价值链层次的事实。

垂直方向的补充层

在搜索 API 之外，Firecrawl 和 Jina Reader 构成了网页提取的补充层。Firecrawl 专注于企业级网页爬虫（支持 Chromium 渲染和复杂交互，AGPL-3.0 协议），Jina Reader 专注于 AI 优化的文本提取（基于 ReaderLM-v2 模型，Apache-2.0 协议）。它们与搜索 API 是互补而非竞争关系——搜索 API 找到 URL，Firecrawl/Jina 提取完整内容。

三、市场为什么持续吸引资本

驱动力一：AI Agent 的爆炸式增长

这是最根本的驱动力。据 Grand View Research 数据，全球 AI Agent 市场规模从 2024 年的约 $ 54-59 亿增长至 2025 年的 $76.3 亿，预计 2033 年将达到 $1829.7 亿，2026-2033 年的 CAGR 高达 49.6%。每个 Agent 都需要感知外部世界的能力——搜索 API 就是 Agent 的"眼睛和耳朵"。Cursor、Claude、ChatGPT、各种编码助手和自动化工作流，每一个都在消耗搜索 API 调用。这个需求不是线性增长而是指数级爆发。

驱动力二：RAG 成为 LLM 应用标配

RAG（检索增强生成）已经从"可选技术方案"变成了"LLM 应用的默认架构"。Grand View Research 估计 2024 年全球 RAG 市场规模为 $ 12 亿，预计到 2030 年将达到 $110 亿，CAGR 约 49.1%。RAG 的核心就是"先搜索，再生成"——搜索 API 是这个链条上不可替代的环节。没有高质量的搜索结果输入，LLM 的输出就是无源之水。

驱动力三：传统搜索引擎的根本不适配

Google 的 Custom Search JSON API 和 Bing Web Search API 虽然也能用，但它们存在根本性的不适配问题。它们返回的是 HTML 页面（需要额外解析），速率限制严格且昂贵（Google 免费额度仅 100 次/天，付费 $5/千次），结果中充斥着广告和 SEO 内容，没有为 LLM 消费做任何优化。正如一位微信公众号作者所总结的："Google 是为人类、广告、SEO 和点击设计的。Exa 是为 AI 设计的。"这种根本性的差异使得专为 AI 设计的搜索 API 有了独立存在的价值。

驱动力四：MCP 协议降低了集成门槛

Anthropic 推出的 Model Context Protocol（MCP）在 2025 年迅速成为行业标准。它将搜索工具的集成从"定制开发"变成了"插件化接入"。Tavily、Exa 等都已发布官方 MCP Server。这大幅降低了开发者的接入成本，使得搜索 API 的采用速度加快。但硬币的另一面是——MCP 也降低了切换成本，加剧了竞争。

为什么不是赢家通吃

这个市场能容纳多个玩家，原因有三。首先，不同应用场景对搜索 API 的需求差异巨大——编码助手需要代码和文档搜索，聊天机器人需要实时性和准确性，企业搜索强调隐私和垂直性，金融监控要求专业数据和极低延迟。单一通用搜索 API 无法完全满足所有场景。其次，定价策略的巨大差异（$ 0.30 到 $10/千次）本身就创造了不同的市场层次——预算敏感的 MVP 用 Serper，追求质量的生产系统用 Exa，主流开发者用 Tavily。第三，技术路线的多元化（自建索引 vs SERP 抓取 vs 混合聚合）意味着每条路线都有其不可替代的优势。

投融资汇总

公司	累计融资	最新轮次	估值	关键投资方
Exa	$1.11 亿	B 轮 ($8500 万)	$7 亿	Benchmark, NVIDIA, Lightspeed
Perplexity	$17.2 亿	多轮	$200 亿	IVP, SoftBank
Tavily	$2500 万	A 轮 ($ 2000 万) → 被 Nebius 以 $2.75 亿收购	~$2.75 亿（收购价）	Insight Partners → Nebius
Brave	浏览器生态融资	-	未独立融资	-

资本持续涌入的逻辑很清晰：AI Agent 市场的增速（49.6% CAGR）保证了搜索 API 的硬需求，且当前竞争格局尚未固化，仍有大量差异化机会。从已知玩家的营收反推——Exa 约 $ 1200 万、Tavily 被收购前 ARR 约 $280 万、Serper 等未披露但体量应在百万美元级——当前 AI Search API 细分市场的年收入规模可能仅在 $ 5000 万- $1 亿左右。但考虑到 AI Agent 和 RAG 市场的爆发式增长（AI Agent CAGR 49.6%，RAG CAGR 49.1%），搜索 API 作为两者的共同基础设施，中期（2028-2030）TAM 达到数十亿美元级是合理预期。

四、Exa 为什么"能搞出来"

回到你最核心的问题——Exa 为什么能搞出来？答案可以从五个维度总结。

第一，选对了时间窗口。 Exa 成立于 2021 年（当时还叫 Metaphor），远在 ChatGPT 引爆 AI 革命之前。当 2023 年 RAG 架构开始普及时，Exa 的嵌入式搜索索引已经准备就绪。先发优势不是因为"预见了 ChatGPT"，而是因为"相信搜索的未来不在关键词"。

第二，选对了技术路线的极端。 绝大多数创业公司会选择"更快上线"的路线——抓 Google 结果或聚合多源数据。Exa 选择了最难的路：从零构建索引和神经搜索引擎。这条路前期极其困难（需要海量计算资源和数据），但一旦建成，形成的壁垒远高于 API 封装类产品。这就是 Bitter Lesson 的体现——投入更多计算量的方法，长期一定胜出。

第三，创始团队的技术基因。 Will Bryk 有实时 AI 产品开发经验（Cresta），Jeffrey Wang 有大规模数据基础设施经验（Plaid）。两人在哈佛就在宿舍跑 GPU 集群，对"搜索是一个可以用神经网络从第一性原理解决的问题"有深刻直觉。团队中还有来自 Apple、Google、Bing 的前研究员作为顾问，以及清华大学姚班背景的 Hubert Yuan 等核心工程师。

第四，锚定了 B2D（面向开发者）的正确定位。 Exa 没有去做 C 端搜索引擎（那条路上有 Perplexity），而是专注做"AI 的搜索基础设施"——通过 API 服务编码助手、AI Agent、企业工作流。这个定位避开了与 Google、Perplexity 的直接竞争，同时享受了它们的客户增长红利。

第五，投资方的杠杆效应。 NVIDIA 的持续投资不仅是资金支持，更是算力资源和生态背书。Benchmark 的加入则意味着一级市场最顶级的操盘手在帮助 Exa 进行商业化扩张。Peter Fenton 进入董事会的决定本身就是一种市场信号。

五、市场未来走向

短期（2026-2027）： 竞争格局初步定型。Exa 凭借技术壁垒和资本优势巩固高端市场，Tavily 被收购后其市场份额可能被 Exa 和新进入者瓜分。SERP 抓取类产品继续在成本敏感市场保有一席之地。开发者普遍采用"多 API 混合策略"——基础查询用 Serper 降本，高价值查询用 Exa 保质。

中期（2027-2028）： 垂直化和并购时代到来。金融、法律、医疗等领域的专用搜索 API 开始出现。OpenAI、Microsoft 等平台方可能通过收购搜索 API 公司来补齐内置搜索能力，或自建同类产品，对独立搜索 API 公司构成威胁。

长期（2029+）： 搜索 API 成为 AI 基础设施的"水电煤"。当 LLM 的上下文窗口继续增大、推理能力持续增强时，搜索 API 的价值不会消失——它会从"信息检索"演变为"实时知识获取和验证"的角色，成为 AI 系统连接现实世界的核心接口。

关键风险： LLM 平台方内置搜索能力可能压缩独立搜索 API 的空间；Google 如果认真投入 AI 优化的搜索 API 可能改变游戏规则；经济周期调整可能影响 AI 投资热度。

结论

AI Search API 不只是一个 API 产品类别，它是整个 AI Agent 生态的基础设施层。Exa 能杀出重围，是因为它做了一个"正确但困难"的选择——从第一性原理重构搜索，而不是在 Google 之上做封装。市场持续有资本涌入，是因为 AI Agent 的爆发式增长（49.6% CAGR）创造了刚性需求，而不同技术路线和应用场景的差异化空间为多个玩家留下了生存余地。

用 Will Bryk 在 B 轮公告中的话来总结："The world is ready for a new type of search." 世界已经准备好迎接新型搜索了——这一次，搜索的用户不再是人类，而是 AI。