five

AutoFill

收藏
RapidAPI2026-04-24 更新2026-04-25 收录
下载链接:
https://rapidapi.com/12devs-12devs-default/api/autofill
下载链接
链接失效反馈
官方服务:
资源简介:
An universal engine for automated data extraction from unstructured documents (PDFs, scans, photos) and automated form filling
创建时间:
2026-04-24
原始信息汇总

好的,这是根据您提供的HTML内容生成的关于“AutoFill”数据集的概述。


数据集概览:AutoFill API

AutoFill API 是一个专门用于从物流和商业文档(如发票、提单、交货证明、运输标签等)中提取结构化数据的API服务。它能够将PDF、扫描件或照片等非结构化文档转换为可用的字段数据,实现自动化的表单填写。

核心功能与工作流程

API的工作流程通常包含两步:

  1. 文件上传 (POST /upload)

    • 支持上传 PDFPNGJPEG 格式的文件。
    • 文件大小上限为 30 MB
    • 上传成功后会返回一个 filePath 标识符,用于下一步处理。
  2. 字段提取 (POST /recognize)

    • 使用上一步获取的 filePath 和自定义的字段名称列表(例如 ["发票号码", "总金额"])进行识别。
    • 支持 manual(手动指定字段)和 auto(自动使用内置通用字段集)两种模式。
    • 支持OCR语言提示(如 rus, eng, deu, fra 等),默认值为 rus+eng
    • 返回包含提取值、原始OCR文本、布局信息、处理时间和置信度等元数据的JSON对象。

关键特性

  • 字段模板 (Templates):可以将一组字段保存为模板,供不同文档重复使用。API也内置了常见物流文档的预设模板。
  • 页面预览 (Page Preview):通过 GET /pages/{filePath}/{pageNumber} 端点,可以获取PDF文档指定页面的PNG预览图。
  • 历史记录 (History):通过 /history 端点可以查看过去识别运行的日志。
  • 辅助端点 (Assist):提供一个 assist 端点,用于生成用户可读的字段描述。
  • 运行状况监控 (Health / Metrics):提供 /ping/health/metrics 等端点用于服务监控。

使用限制

  • 上传文件:最大 30 MB,支持 PDF、PNG、JPEG。
  • JSON请求体:最大 5 MB
  • 识别请求:单次请求最长处理时间约为 120 秒

认证与开发

  • 认证方式:通过RapidAPI平台进行认证,需要提供 x-rapidapi-keyx-rapidapi-host
  • 数据隐私
    • 上传的文件在处理和预览后,大约一天后会被自动删除。
    • 识别历史会存储字段名和文本摘要等上下文信息,但不会长期归档完整文档。
    • 文档内容在处理过程中可能会经过第三方AI和OCR服务。
    • 针对高度敏感的数据,可以联系提供商定制独立的处理环境。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作