five

PII Discovery Scan

收藏
RapidAPI2026-04-23 更新2026-04-22 收录
下载链接:
https://rapidapi.com/datahawkshaw/api/pii-discovery-scan
下载链接
链接失效反馈
官方服务:
资源简介:
PII detection for text, files, and databases. Built for GDPR, CCPA, and data privacy compliance.
创建时间:
2026-04-23
原始信息汇总

根据您提供的数据集详情页面内容,以下是对该API的详细总结。

数据集概述:PII Discovery Scan API

这是一个企业级的隐私合规扫描工具,用于自动检测和分类文本、文件及数据库中的个人身份信息(PII)。

1. 核心功能

该API提供三种主要的PII扫描方式:

  • 文本扫描:直接输入文本内容或从URL(如Pastebin、GitHub Gist)获取内容进行扫描。
  • 文件处理:支持扫描多种文件格式,包括PDF(含OCR)、Microsoft Office(DOCX、XLSX、XLS)、CSV/TXT,单文件支持最大50MB。
  • 数据库连接:支持直接连接PostgreSQL、MySQL/MariaDB和MongoDB数据库进行模式分析和数据采样。

2. 检测能力

API能够检测以下 8种 个人身份信息类型,并附带置信度评分(最高98%)和上下文验证:

  • 邮箱地址(中等敏感度)
  • 出生日期(高敏感度)
  • 电话号码(国际及美国/加拿大格式,中等敏感度)
  • IP地址(IPv4和IPv6,低敏感度)
  • 护照号码(关键敏感度)
  • 信用卡号(含Luhn算法校验,关键敏感度)
  • 社会安全号码(SSN)(关键敏感度)
  • 英国国家保险号码(NINO)(关键敏感度)

每次检测结果包含敏感度分类(低/中/高/关键)、位置上下文和脱敏预览。

3. 企业级特性

  • 异步处理:大于25MB的文件支持后台处理及实时进度跟踪。
  • 分块处理:大型文件自动分割为优化块进行并行处理。
  • 连接池:高级别套餐支持多个并发数据库连接。

4. 安全与隐私

  • 零数据保留:数据仅内存处理,扫描后立即丢弃。
  • 端到端加密:所有通信使用TLS 1.2+加密。
  • 合规支持:协助满足GDPR、CCPA、HIPAA、PCI-DSS等法规要求。

5. 定价套餐

套餐 价格 每月请求数 文件大小上限 数据库扫描 月数据处理量
BASIC 免费 10次 10KB(无PDF) 1次 2MB
PRO $49/月 100次 10MB 10次 430MB
ULTRA $149/月 500次 25MB 50次 6.75GB
MEGA $399/月 1,000+次 50MB 200次 32GB

6. API端点

  • GET /api/v1/health:检查API健康状态。
  • GET /api/v1/patterns:获取所有可检测的PII类型信息。
  • POST /api/v1/scan-text:扫描文本内容或URL来源内容。
  • POST /api/v1/scan-file:上传并扫描文件。
  • POST /api/v1/scan-database:连接并扫描数据库。
  • GET /api/v1/job-status/{job_id}:查询异步作业状态(适用于大于25MB的文件)。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作