NER API (spaCy, EU-based)
收藏NER API (spaCy, EU-based) 数据集概述
基本信息
- 数据集名称: NER API (spaCy, EU-based)
- 提供方: Flash Systems
- 类别: Text Analysis
- 访问平台: RapidAPI
- 状态: Freemium
- 流行度: 1.9 Popularity
- 服务等级: 100% Service Level
- 延迟: 3439ms Latency
定价方案
- BASIC: $0.00 / 月
- PRO: $19.00 / 月
- ULTRA: $89.00 / 月
- MEGA: $299.00 / 月
核心描述
Redact-NER-API 提供了一个安全、符合 GDPR 要求的方式来从文本中提取实体。该 API 基于工业级的 spaCy 库构建,并专门托管在 Google Cloud Run Europe-West3(法兰克福),确保您的数据永不离开欧盟,并且在内存中处理,零持久化。
主要特性
- 隐私优先: 不记录请求正文。不存储数据。处理是临时的。
- 欧盟托管: 保证在
europe-west3(德国)进行处理。 - 确定性: 使用
en_core_web_lg对相同的输入返回相同的结果。 - 全面性: 提取人员、地点、组织、日期、电子邮件、电话、IBAN、IP 等实体。
- 鲁棒性: 结合深度学习(spaCy)和严格正则表达式验证的混合引擎。
技术规格
- 基础 URL: https://redact-ner-api.p.rapidapi.com/v1/ner
- 主要端点:
POST /v1/ner - 认证方式: 通过
X-RapidAPI-Key请求头进行 RapidAPI 认证。 - 请求格式:
application/json - 文本输入限制: 最大 50KB。
支持的语言
API 自动检测文本语言,无需配置。
- 英语 (
en) - 德语 (
de) - 法语 (
fr) - 西班牙语 (
es) - 意大利语 (
it) - 荷兰语 (
nl)
支持的实体类型
通用实体
PERSONORGDATETIMEPERCENTMONEYPRODUCTEVENTLAWNORP
位置实体
ADDRESS(从 GPE/LOC/FAC 标准化而来)
标识符实体
EMAILPHONEURLIP_ADDRESSUSERNAMEID_NUMBER
金融实体
CREDIT_CARDIBANCRYPTO_ADDRESS
请求与响应示例
示例请求体
json { "text": "Please contact John Doe at john.doe@example.com before sending 500$ to 1A1zP1eP5QGefi2DMPTfTL5SLmv7DivfNa.", "entities": ["PERSON", "EMAIL", "CRYPTO", "MONEY"] }
示例响应体
json { "entities": [ { "type": "PERSON", "value": "John Doe", "start": 15, "end": 23, "path": "$.text" }, { "type": "EMAIL", "value": "john.doe@example.com", "start": 27, "end": 47, "path": "$.text" }, { "type": "MONEY", "value": "500$", "start": 63, "end": 67, "path": "$.text" }, { "type": "CRYPTO", "value": "1A1zP1eP5QGefi2DMPTfTL5SLmv7DivfNa", "start": 71, "end": 105, "path": "$.text" } ] }
性能提示
- 预热: 对特定语言(例如法语)的首次请求可能需要 5-10 秒来加载 AI 模型。后续请求将快速到毫秒级。
- 批处理: 为了获得最佳吞吐量,请发送完整的段落而不是单个句子。
- 过滤: 仅请求您需要的实体(例如仅
["EMAIL", "PHONE"])以获得更清晰的响应,尽管性能相似。
代码示例
提供了 Python (Requests) 和 Node.js (Axios) 的调用示例。




