OCR Document Pro

RapidAPI2026-04-27 更新2025-02-08 收录

下载链接：

https://rapidapi.com/hardysatiro/api/ocr-document-pro

下载链接

链接失效反馈

官方服务：

资源简介：

OCR Document Pro is a high-precision OCR API for extracting text, barcodes, and QR codes from PDFs (including password-protected) and images, with optional bounding box data for advanced layouts.

创建时间：

2026-04-27

原始信息汇总

OCR Document Pro 数据集概述

基本信息

数据集名称: OCR Document Pro
提供平台: RapidAPI
API 创建者: CronexAI
类别: Visual Recognition
订阅者数量: 116
流行度评分: 9.7
服务等级: 100%
延迟: 10081ms
测试状态: 100%

功能描述

OCR Document Pro 是一个强大且可靠的 API，旨在从各种文档格式（包括多页 PDF 和常见图像类型，如 JPEG、PNG）中无缝提取文本。它利用先进的 OCR 技术，确保高精度和高效率。

核心功能

PDF 和图像兼容性: 可处理最多 5 页的 PDF 和标准图像格式。
条形码和二维码识别: 自动检测并提取文档页面中嵌入的任何条形码和二维码。
受密码保护 PDF 的安全 OCR: 通过简单地在有效负载中提供密码，对受保护的 PDF 执行 OCR，确保对内容的授权访问。
用于精确布局的边界框: 可选择返回每个单词的边界框坐标，允许精确定位和文档内文本的视觉控制。（注意：此选项可能会增加响应负载大小。）
先进的 OCR 技术: 利用最新的 OCR 进步，确保高精度，即使面对不同的文档格式和质量水平。

主要用例

将纸质文档数字化以便存档和搜索。
从发票和收据中提取数据。
处理表单和调查以进行自动数据录入。
分析带有嵌入代码的文档以快速检索信息。

技术规格

端点

主要端点: POST /extract

请求参数

file (必需): 用于 PDF 或图像的 base64 或 fileUrl。
password (可选): 用于访问受保护 PDF 文件的密码。
barcode (可选): 布尔值（true 或 false），用于指定文档中的条形码和二维码检测。默认值：false。
textPage (可选): 布尔值（true 或 false），用于将文本提取限制在 PDF 的特定页面。默认值：false。
boundingBoxObject (可选): 布尔值（true 或 false），用于启用每个单词的边界框坐标。请注意，这会增加响应负载。默认值：false。

订阅计划

BASIC: $0.00 / 月
PRO: $2.00 / 月
ULTRA: $5.00 / 月
MEGA: $20.00 / 月

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集提供高精度OCR服务，可从PDF（含加密文件）和图像中提取文本、条形码及二维码，并支持输出边界框数据以分析复杂版面。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集