five

PII Redaction

收藏
RapidAPI2026-02-13 更新2026-02-13 收录
下载链接:
https://rapidapi.com/droizman159/api/pii-redaction
下载链接
链接失效反馈
官方服务:
资源简介:
Detect and redact personally identifiable information (PII) from text. GDPR-ready. 3-layer detection: regex, NLP, and AI.
创建时间:
2026-02-13
原始信息汇总

PII Redaction API 数据集概述

基本信息

  • 数据集名称:PII Redaction
  • 类别:Text Analysis
  • 提供者:daniel roizman
  • 订阅者数量:1

API 性能指标

  • 流行度:8.9
  • 服务等级:100%
  • 延迟:2729ms
  • 测试通过率:100%

功能描述

检测并编辑文本中的个人身份信息(PII)。专为需要GDPR/隐私合规性但不想构建自己的PII管道的开发人员而构建。采用3层检测管道:正则表达式模式匹配、NLP(spaCy)和AI(Claude)。

端点

  • POST /redact:使用模式匹配和NLP进行快速检测。
  • POST /redact/deep:AI驱动的深度扫描,可捕获上下文相关的PII(需要Pro计划)。

请求体参数

字段 类型 必需 默认值 描述
text string 要扫描的文本(最多50,000个字符)
mode string mask mask 替换为[TYPE];hash 替换为8字符哈希;synthetic 替换为逼真的假数据
entities array ["all"] 筛选特定类型,例如["PERSON", "EMAIL"]

可检测的实体类型

PERSON、EMAIL、PHONE、ADDRESS、LOCATION、DATE、SSN、CREDIT_CARD、FINANCIAL、IP_ADDRESS、USERNAME、ID_NUMBER、ORGANIZATION、MEDICAL。

深度扫描(Pro计划)

捕获基本检测遗漏的内容:

  • 昵称和非正式名称
  • 交叉街道地址和模糊位置
  • 社交媒体句柄
  • 自然语言中的日期
  • 揭示身份的关系
  • 部分账号号码

编辑模式

  • mask(默认):用[TYPE]标签替换PII。
  • hash:用8字符哈希替换PII。
  • synthetic:用逼真的假数据替换PII。

响应示例

json { "redacted_text": "Contact [PERSON] at [EMAIL]", "entities_found": [ { "type": "PERSON", "original": "John Smith", "start": 8, "end": 18, "confidence": 0.85 }, { "type": "EMAIL", "original": "john@gmail.com", "start": 22, "end": 36, "confidence": 1.0 } ], "stats": { "total_entities": 2, "processing_time_ms": 15.2, "layers_used": ["regex", "presidio"], "plan": "FREE" } }

订阅计划

计划 价格 每月请求数 可用端点
Free $0 50 /redact
Pro $14/mo 1,000 /redact + /redact/deep
Ultra $49/mo 5,000 /redact + /redact/deep
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
PII Redaction 数据集用于从文本中检测和编辑个人身份信息(PII),符合GDPR要求。它采用三层检测方法,包括正则表达式、自然语言处理(NLP)和人工智能(AI)。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作