PII Discovery Scan
收藏RapidAPI2026-04-23 更新2026-04-22 收录
下载链接:
https://rapidapi.com/datahawkshaw/api/pii-discovery-scan
下载链接
链接失效反馈官方服务:
资源简介:
PII detection for text, files, and databases. Built for GDPR, CCPA, and data privacy compliance.
创建时间:
2026-04-23
原始信息汇总
根据您提供的数据集详情页面内容,以下是对该API的详细总结。
数据集概述:PII Discovery Scan API
这是一个企业级的隐私合规扫描工具,用于自动检测和分类文本、文件及数据库中的个人身份信息(PII)。
1. 核心功能
该API提供三种主要的PII扫描方式:
- 文本扫描:直接输入文本内容或从URL(如Pastebin、GitHub Gist)获取内容进行扫描。
- 文件处理:支持扫描多种文件格式,包括PDF(含OCR)、Microsoft Office(DOCX、XLSX、XLS)、CSV/TXT,单文件支持最大50MB。
- 数据库连接:支持直接连接PostgreSQL、MySQL/MariaDB和MongoDB数据库进行模式分析和数据采样。
2. 检测能力
API能够检测以下 8种 个人身份信息类型,并附带置信度评分(最高98%)和上下文验证:
- 邮箱地址(中等敏感度)
- 出生日期(高敏感度)
- 电话号码(国际及美国/加拿大格式,中等敏感度)
- IP地址(IPv4和IPv6,低敏感度)
- 护照号码(关键敏感度)
- 信用卡号(含Luhn算法校验,关键敏感度)
- 社会安全号码(SSN)(关键敏感度)
- 英国国家保险号码(NINO)(关键敏感度)
每次检测结果包含敏感度分类(低/中/高/关键)、位置上下文和脱敏预览。
3. 企业级特性
- 异步处理:大于25MB的文件支持后台处理及实时进度跟踪。
- 分块处理:大型文件自动分割为优化块进行并行处理。
- 连接池:高级别套餐支持多个并发数据库连接。
4. 安全与隐私
- 零数据保留:数据仅内存处理,扫描后立即丢弃。
- 端到端加密:所有通信使用TLS 1.2+加密。
- 合规支持:协助满足GDPR、CCPA、HIPAA、PCI-DSS等法规要求。
5. 定价套餐
| 套餐 | 价格 | 每月请求数 | 文件大小上限 | 数据库扫描 | 月数据处理量 |
|---|---|---|---|---|---|
| BASIC | 免费 | 10次 | 10KB(无PDF) | 1次 | 2MB |
| PRO | $49/月 | 100次 | 10MB | 10次 | 430MB |
| ULTRA | $149/月 | 500次 | 25MB | 50次 | 6.75GB |
| MEGA | $399/月 | 1,000+次 | 50MB | 200次 | 32GB |
6. API端点
- GET
/api/v1/health:检查API健康状态。 - GET
/api/v1/patterns:获取所有可检测的PII类型信息。 - POST
/api/v1/scan-text:扫描文本内容或URL来源内容。 - POST
/api/v1/scan-file:上传并扫描文件。 - POST
/api/v1/scan-database:连接并扫描数据库。 - GET
/api/v1/job-status/{job_id}:查询异步作业状态(适用于大于25MB的文件)。



