five

DataCompassIO-SearchAI

收藏
RapidAPI2026-03-28 更新2026-03-29 收录
下载链接:
https://rapidapi.com/datacompassio-datacompassio-default/api/datacompassio-searchai
下载链接
链接失效反馈
官方服务:
资源简介:
AI-powered search API with semantic understanding. Upload content, get instant hybrid search combining vector embeddings with keyword matching. One API to replace building your own search infrastructure.
创建时间:
2026-03-28
原始信息汇总

DataCompassIO-SearchAI 数据集概述

基本信息

  • 数据集名称: DataCompassIO-SearchAI
  • 类别: Search APIs
  • 提供商: DataCompassIO
  • 当前版本: v1

功能描述

SearchAI 可将任何内容在数分钟内转换为可搜索的、由AI驱动的知识库。上传文档(JSON、HTML、PDF),系统会自动进行分块、嵌入和索引。通过结合语义理解与传统关键词匹配的混合搜索进行查询,可根据含义而不仅仅是精确词汇来查找结果。

核心特性

  • 文档摄取: 支持 JSON、HTML、PDF 格式,自动文本提取。
  • 可配置分块: 可按索引配置分块大小和重叠度。
  • 嵌入模型: 使用 Cohere AI 嵌入(1024维向量)。
  • 混合搜索: 语义相似度 + 关键词 BM25 + 互惠排名融合(RRF)。
  • 可调搜索模式: 纯语义、纯关键词或混合模式。
  • 多索引支持: 每个账户支持多个索引。
  • 使用情况跟踪与速率限制

计划推出的功能

  • AI 答案生成(RAG)— 提出问题,获得带有引用的综合答案。
  • SEO 内容分析 — 质量评分、重复检测、覆盖范围差距分析。
  • 通过 Webhook 自动同步 — 自动保持索引最新。
  • 可嵌入网站的搜索小部件。

订阅计划与限制

层级 月费 速率限制 文档数量上限 索引数量上限
BASIC $0.00 50 次调用/月 1,000 1
PRO $20.00 1,000 次调用/天 10,000 3
ULTRA $50.00 10,000 次调用/天 100,000 10

主要 API 端点

索引管理

  • POST /v1/indexes: 创建新的搜索索引。
  • GET /v1/indexes: 列出 API 密钥下的所有索引。
  • DELETE /v1/indexes/{index_id}: 删除索引及其所有文档和分块。

文档管理

  • POST /v1/indexes/{index_id}/documents: 将文档摄取到索引中。自动提取文本、分块、嵌入和索引。
  • GET /v1/indexes/{index_id}/documents: 列出索引中的文档。
  • DELETE /v1/indexes/{index_id}/documents/{doc_id}: 删除文档及其分块。

搜索与使用情况

  • POST /v1/search: 跨索引进行混合 AI 搜索。通过互惠排名融合结合语义相似度和关键词匹配。
  • GET /v1/usage: 检查当前 API 使用情况。
  • GET /health: 服务健康检查(无需认证)。

认证方式

在每个请求的 X-API-Key 标头中传递 API 密钥。

工作原理

  1. 上传 — 通过文档端点发送内容(文本、HTML 或 PDF)。
  2. 分块 — 内容在段落/句子边界处被分割成重叠的片段。
  3. 嵌入 — 每个分块通过 Cohere AI 嵌入获得一个 1024 维向量。
  4. 索引 — 向量存储在 pgvector 中,文本被索引用于关键词搜索。
  5. 搜索 — 查询被嵌入,并与向量相似度和关键词相关性进行匹配。
  6. 排名 — 结果通过互惠排名融合结合,获得最佳综合排名。

错误响应

常见 HTTP 状态码及含义:

  • 400: 错误请求(内容无效、过短)。
  • 401: 缺少或无效的 API 密钥。
  • 403: 层级限制超出(索引、文档)。
  • 404: 索引或文档未找到。
  • 409: 重复(索引名称或 external_id)。
  • 429: 超出速率限制。
  • 500: 内部错误。

支持信息

  • API 状态: https://searchai.datacompass.io/health
  • 联系邮箱: dave@datacompass.io
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作