AutoFill

RapidAPI2026-04-24 更新2026-04-25 收录

下载链接：

https://rapidapi.com/12devs-12devs-default/api/autofill

下载链接

链接失效反馈

官方服务：

资源简介：

An universal engine for automated data extraction from unstructured documents (PDFs, scans, photos) and automated form filling

创建时间：

2026-04-24

原始信息汇总

好的，这是根据您提供的HTML内容生成的关于“AutoFill”数据集的概述。

AutoFill API 是一个专门用于从物流和商业文档（如发票、提单、交货证明、运输标签等）中提取结构化数据的API服务。它能够将PDF、扫描件或照片等非结构化文档转换为可用的字段数据，实现自动化的表单填写。

API的工作流程通常包含两步：

文件上传 (POST /upload)
- 支持上传 PDF、PNG 和 JPEG 格式的文件。
- 文件大小上限为 30 MB。
- 上传成功后会返回一个 filePath 标识符，用于下一步处理。
字段提取 (POST /recognize)
- 使用上一步获取的 filePath 和自定义的字段名称列表（例如 ["发票号码", "总金额"]）进行识别。
- 支持 manual（手动指定字段）和 auto（自动使用内置通用字段集）两种模式。
- 支持OCR语言提示（如 rus, eng, deu, fra 等），默认值为 rus+eng。
- 返回包含提取值、原始OCR文本、布局信息、处理时间和置信度等元数据的JSON对象。

字段模板 (Templates)：可以将一组字段保存为模板，供不同文档重复使用。API也内置了常见物流文档的预设模板。
页面预览 (Page Preview)：通过 GET /pages/{filePath}/{pageNumber} 端点，可以获取PDF文档指定页面的PNG预览图。
历史记录 (History)：通过 /history 端点可以查看过去识别运行的日志。
辅助端点 (Assist)：提供一个 assist 端点，用于生成用户可读的字段描述。
运行状况监控 (Health / Metrics)：提供 /ping、/health 和 /metrics 等端点用于服务监控。

认证方式：通过RapidAPI平台进行认证，需要提供 x-rapidapi-key 和 x-rapidapi-host。
数据隐私：
- 上传的文件在处理和预览后，大约一天后会被自动删除。
- 识别历史会存储字段名和文本摘要等上下文信息，但不会长期归档完整文档。
- 文档内容在处理过程中可能会经过第三方AI和OCR服务。
- 针对高度敏感的数据，可以联系提供商定制独立的处理环境。

5,000+

优质数据集

54 个

任务类型

进入经典数据集