OCR Text Extractor

RapidAPI2025-12-05 更新2025-12-03 收录

下载链接：

https://rapidapi.com/apimatrix/api/ocr-text-extractor5

下载链接

链接失效反馈

官方服务：

资源简介：

Extract text from images, documents and other medias

从图像、文档及其他媒介中提取文本

创建时间：

2025-12-05

原始信息汇总

OCR Text Extractor 数据集概述

基本信息

数据集名称: OCR Text Extractor
提供平台: RapidAPI
API 版本: v1 (current)
所属类别: Visual Recognition
API 创建者: ApiMatrixLabs
订阅者数量: 4

性能与评级

流行度: 8.8 Popularity
服务等级: 100% Service Level
延迟: 3670ms Latency
测试状态: N/A Test

定价计划

BASIC: $0.00 / mo
PRO: $6.99 / mo
ULTRA: $14.99 / mo
MEGA: $79.99 / mo

功能描述

该 API 使用先进的 AI 模型，自动从图像中检测并高精度提取文本。无论是扫描文档、照片还是截图，API 都能将视觉文本转换为可编辑的、机器可读的内容，适用于数据处理、文档自动化和数字归档。出于隐私和安全考虑，文件从不存储；API 仅转换和处理每个图像的 Base64 编码版本，并将其发送到模型进行解析。

主要特性

接受图像和 PDF 上传（JPG、PNG、PDF、GIF、BMP、WEBP）
通过 JSON 接受 base64 编码的文件
使用 AI 模型提取文本
检测提取文本的语言
返回结构化 JSON，包含提取的文本、文档类型、置信度和语言

API 使用

端点

POST https://ocr-text-extractor5.p.rapidapi.com/api/extract-text

请求类型

1. 文件上传 (multipart/form-data)

Content-Type: multipart/form-data
字段名称: file
接受格式: JPEG, PNG, PDF, GIF, BMP, WEBP (最大 10MB)

2. JSON (base64)

Content-Type: application/json

响应示例

json { "message": "Text extracted successfully", "formatted": "Text with preserved line breaks and layout", "raw": "Text without any special formatting or line breaks", "documentType": "receipt", "confidence": "high", "detectedLanguage": "en", "characterCount": 123 }

响应字段说明

formatted: 保留布局的提取文本
raw: 无格式文本
documentType: 检测到的文档类型
confidence: 文档类型的置信度
detectedLanguage: 检测到的语言的 ISO 代码
characterCount: 原始文本中的字符数

搜集汇总

数据集介绍

背景与挑战

背景概述

OCR Text Extractor数据集用于从图像、文档及其他媒体中提取文本信息。它专注于实现文本内容的自动化提取功能。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集