Sofya 是一个统一 API,为 AI 智能体提供网页搜索、抓取、提取和研究能力。它通过单一端点实现网页搜索(返回完整页面内容,而非摘要)、以干净 Markdown 格式抓取任意 URL、利用 AI 提取结构化数据,以及执行深度多源研究。开发者可通过 REST 或 MCP API 集成,并为 GitHub 认证开发者提供免费套餐。
AI 智能体研究
智能体可对任意主题进行深度研究,将查询拆解为子查询,并综合最多 30 个来源生成报告。
数据提取
利用 AI 从网页中提取特定信息,如定价表、联系信息或规格参数。
内容抓取
以干净 Markdown 格式获取任意 URL(网页、PDF、DOCX 及其他文档格式),供下游处理。
网页搜索自动化
搜索网页并获取完整页面内容(而非摘要),支持调整搜索深度以平衡速度与细节。
多工具基准测试
开发者可在自动化智能体基准测试中,将 Sofya 与其他搜索和抓取工具进行直接对比。
智能体工作流
通过 MCP 服务器与 Claude Code、Cursor、Codex、Windsurf、VS Code 等工具集成。
搜索 API(POST /v1/search)
搜索网页并获取完整页面内容,而非仅摘要。可选择搜索深度以平衡速度与细节。每次调用消耗 1–3 积分。
抓取 API(POST /v1/fetch)
抓取任意 URL 并获取干净 Markdown 格式内容。支持网页、PDF、DOCX 及其他文档格式。每个 URL 消耗 1 积分。
提取 API(POST /v1/extract)
抓取页面并利用 AI 提取特定信息——定价表、联系信息、规格参数或您描述的任何内容。消耗 5 积分。
研究 API(POST /v1/research)
对任意主题进行深度研究。将问题拆解为子查询,搜索最多 30 个来源,然后综合生成带有引用和置信度标签的结构化报告。消耗 25 积分。
干净 Markdown 输出
根据 AI 智能体基准测试,抓取功能在同类工具中能生成最干净的 Markdown 格式。
MCP 和 REST API
通过 MCP 服务器集成,与 Claude Code、Cursor、Codex、Windsurf、VS Code 等工具配合使用。
GitHub 认证开发者免费套餐
拥有 GitHub 账户的开发者可访问免费套餐(详情见定价页面)。
/v1/search、/v1/fetch、/v1/extract 或 /v1/research。Sofya 为 GitHub 认证开发者提供免费套餐。每次 API 调用消耗积分:搜索消耗 1–3 积分,抓取每个 URL 消耗 1 积分,提取消耗 5 积分,研究消耗 25 积分。完整定价详情请访问官方定价页面。
在与 8 个搜索工具和 6 个抓取工具的直接基准测试中,Sofya 在两个类别均排名第一,该结果来自 Claude Code Opus 4.6 未经编辑的 AI 智能体评价。该智能体称赞其搜索功能能返回完整页面内容(而非摘要),抓取功能能生成所见最干净的 Markdown,研究功能能提供带有引用和置信度标签的结构化报告。该基准测试在无自定义指令或系统提示的情况下进行,使结果具有可信度。对于构建需要快速、深度且干净网页智能的 AI 智能体的开发者而言,Sofya 提供了一个极具吸引力的全合一 API 解决方案。
Sofya通过REST和MCP API为AI代理提供网络搜索、获取、提取和研究功能。它提供简洁的Markdown输出,并为GitHub认证的开发者提供免费套餐。
分类:AI 搜索
访问链接:https://sofya.co/
标签:AI代理、网络搜索API、数据提取、MCP API、开发者工具