OCR Document Pro
收藏RapidAPI2026-04-27 更新2025-02-08 收录
下载链接:
https://rapidapi.com/hardysatiro/api/ocr-document-pro
下载链接
链接失效反馈官方服务:
资源简介:
OCR Document Pro is a high-precision OCR API for extracting text, barcodes, and QR codes from PDFs (including password-protected) and images, with optional bounding box data for advanced layouts.
创建时间:
2026-04-27
原始信息汇总
OCR Document Pro 数据集概述
基本信息
- 数据集名称: OCR Document Pro
- 提供平台: RapidAPI
- API 创建者: CronexAI
- 类别: Visual Recognition
- 订阅者数量: 116
- 流行度评分: 9.7
- 服务等级: 100%
- 延迟: 10081ms
- 测试状态: 100%
功能描述
OCR Document Pro 是一个强大且可靠的 API,旨在从各种文档格式(包括多页 PDF 和常见图像类型,如 JPEG、PNG)中无缝提取文本。它利用先进的 OCR 技术,确保高精度和高效率。
核心功能
- PDF 和图像兼容性: 可处理最多 5 页的 PDF 和标准图像格式。
- 条形码和二维码识别: 自动检测并提取文档页面中嵌入的任何条形码和二维码。
- 受密码保护 PDF 的安全 OCR: 通过简单地在有效负载中提供密码,对受保护的 PDF 执行 OCR,确保对内容的授权访问。
- 用于精确布局的边界框: 可选择返回每个单词的边界框坐标,允许精确定位和文档内文本的视觉控制。(注意:此选项可能会增加响应负载大小。)
- 先进的 OCR 技术: 利用最新的 OCR 进步,确保高精度,即使面对不同的文档格式和质量水平。
主要用例
- 将纸质文档数字化以便存档和搜索。
- 从发票和收据中提取数据。
- 处理表单和调查以进行自动数据录入。
- 分析带有嵌入代码的文档以快速检索信息。
技术规格
端点
- 主要端点:
POST/extract
请求参数
- file (必需): 用于 PDF 或图像的
base64或fileUrl。 - password (可选): 用于访问受保护 PDF 文件的密码。
- barcode (可选): 布尔值(
true或false),用于指定文档中的条形码和二维码检测。默认值:false。 - textPage (可选): 布尔值(
true或false),用于将文本提取限制在 PDF 的特定页面。默认值:false。 - boundingBoxObject (可选): 布尔值(
true或false),用于启用每个单词的边界框坐标。请注意,这会增加响应负载。默认值:false。
订阅计划
- BASIC: $0.00 / 月
- PRO: $2.00 / 月
- ULTRA: $5.00 / 月
- MEGA: $20.00 / 月
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集提供高精度OCR服务,可从PDF(含加密文件)和图像中提取文本、条形码及二维码,并支持输出边界框数据以分析复杂版面。
以上内容由遇见数据集搜集并总结生成



