five

OCR Document Pro

收藏
RapidAPI2026-04-27 更新2025-02-08 收录
下载链接:
https://rapidapi.com/hardysatiro/api/ocr-document-pro
下载链接
链接失效反馈
官方服务:
资源简介:
OCR Document Pro is a high-precision OCR API for extracting text, barcodes, and QR codes from PDFs (including password-protected) and images, with optional bounding box data for advanced layouts.
创建时间:
2026-04-27
原始信息汇总

OCR Document Pro 数据集概述

基本信息

  • 数据集名称: OCR Document Pro
  • 提供平台: RapidAPI
  • API 创建者: CronexAI
  • 类别: Visual Recognition
  • 订阅者数量: 116
  • 流行度评分: 9.7
  • 服务等级: 100%
  • 延迟: 10081ms
  • 测试状态: 100%

功能描述

OCR Document Pro 是一个强大且可靠的 API,旨在从各种文档格式(包括多页 PDF 和常见图像类型,如 JPEG、PNG)中无缝提取文本。它利用先进的 OCR 技术,确保高精度和高效率。

核心功能

  • PDF 和图像兼容性: 可处理最多 5 页的 PDF 和标准图像格式。
  • 条形码和二维码识别: 自动检测并提取文档页面中嵌入的任何条形码和二维码。
  • 受密码保护 PDF 的安全 OCR: 通过简单地在有效负载中提供密码,对受保护的 PDF 执行 OCR,确保对内容的授权访问。
  • 用于精确布局的边界框: 可选择返回每个单词的边界框坐标,允许精确定位和文档内文本的视觉控制。(注意:此选项可能会增加响应负载大小。)
  • 先进的 OCR 技术: 利用最新的 OCR 进步,确保高精度,即使面对不同的文档格式和质量水平。

主要用例

  • 将纸质文档数字化以便存档和搜索。
  • 从发票和收据中提取数据。
  • 处理表单和调查以进行自动数据录入。
  • 分析带有嵌入代码的文档以快速检索信息。

技术规格

端点

  • 主要端点: POST /extract

请求参数

  • file (必需): 用于 PDF 或图像的 base64fileUrl
  • password (可选): 用于访问受保护 PDF 文件的密码。
  • barcode (可选): 布尔值(truefalse),用于指定文档中的条形码和二维码检测。默认值:false
  • textPage (可选): 布尔值(truefalse),用于将文本提取限制在 PDF 的特定页面。默认值:false
  • boundingBoxObject (可选): 布尔值(truefalse),用于启用每个单词的边界框坐标。请注意,这会增加响应负载。默认值:false

订阅计划

  • BASIC: $0.00 / 月
  • PRO: $2.00 / 月
  • ULTRA: $5.00 / 月
  • MEGA: $20.00 / 月
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供高精度OCR服务,可从PDF(含加密文件)和图像中提取文本、条形码及二维码,并支持输出边界框数据以分析复杂版面。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作