PII Redaction
收藏RapidAPI2026-02-13 更新2026-02-13 收录
下载链接:
https://rapidapi.com/droizman159/api/pii-redaction
下载链接
链接失效反馈官方服务:
资源简介:
Detect and redact personally identifiable information (PII) from text. GDPR-ready. 3-layer detection: regex, NLP, and AI.
创建时间:
2026-02-13
原始信息汇总
PII Redaction API 数据集概述
基本信息
- 数据集名称:PII Redaction
- 类别:Text Analysis
- 提供者:daniel roizman
- 订阅者数量:1
API 性能指标
- 流行度:8.9
- 服务等级:100%
- 延迟:2729ms
- 测试通过率:100%
功能描述
检测并编辑文本中的个人身份信息(PII)。专为需要GDPR/隐私合规性但不想构建自己的PII管道的开发人员而构建。采用3层检测管道:正则表达式模式匹配、NLP(spaCy)和AI(Claude)。
端点
- POST /redact:使用模式匹配和NLP进行快速检测。
- POST /redact/deep:AI驱动的深度扫描,可捕获上下文相关的PII(需要Pro计划)。
请求体参数
| 字段 | 类型 | 必需 | 默认值 | 描述 |
|---|---|---|---|---|
| text | string | 是 | — | 要扫描的文本(最多50,000个字符) |
| mode | string | 否 | mask | mask 替换为[TYPE];hash 替换为8字符哈希;synthetic 替换为逼真的假数据 |
| entities | array | 否 | ["all"] | 筛选特定类型,例如["PERSON", "EMAIL"] |
可检测的实体类型
PERSON、EMAIL、PHONE、ADDRESS、LOCATION、DATE、SSN、CREDIT_CARD、FINANCIAL、IP_ADDRESS、USERNAME、ID_NUMBER、ORGANIZATION、MEDICAL。
深度扫描(Pro计划)
捕获基本检测遗漏的内容:
- 昵称和非正式名称
- 交叉街道地址和模糊位置
- 社交媒体句柄
- 自然语言中的日期
- 揭示身份的关系
- 部分账号号码
编辑模式
- mask(默认):用[TYPE]标签替换PII。
- hash:用8字符哈希替换PII。
- synthetic:用逼真的假数据替换PII。
响应示例
json { "redacted_text": "Contact [PERSON] at [EMAIL]", "entities_found": [ { "type": "PERSON", "original": "John Smith", "start": 8, "end": 18, "confidence": 0.85 }, { "type": "EMAIL", "original": "john@gmail.com", "start": 22, "end": 36, "confidence": 1.0 } ], "stats": { "total_entities": 2, "processing_time_ms": 15.2, "layers_used": ["regex", "presidio"], "plan": "FREE" } }
订阅计划
| 计划 | 价格 | 每月请求数 | 可用端点 |
|---|---|---|---|
| Free | $0 | 50 | /redact |
| Pro | $14/mo | 1,000 | /redact + /redact/deep |
| Ultra | $49/mo | 5,000 | /redact + /redact/deep |
搜集汇总
数据集介绍

背景与挑战
背景概述
PII Redaction 数据集用于从文本中检测和编辑个人身份信息(PII),符合GDPR要求。它采用三层检测方法,包括正则表达式、自然语言处理(NLP)和人工智能(AI)。
以上内容由遇见数据集搜集并总结生成



