OCR Text Extractor
收藏RapidAPI2025-12-05 更新2025-12-03 收录
下载链接:
https://rapidapi.com/apimatrix/api/ocr-text-extractor5
下载链接
链接失效反馈官方服务:
资源简介:
Extract text from images, documents and other medias
从图像、文档及其他媒介中提取文本
创建时间:
2025-12-05
原始信息汇总
OCR Text Extractor 数据集概述
基本信息
- 数据集名称: OCR Text Extractor
- 提供平台: RapidAPI
- API 版本: v1 (current)
- 所属类别: Visual Recognition
- API 创建者: ApiMatrixLabs
- 订阅者数量: 4
性能与评级
- 流行度: 8.8 Popularity
- 服务等级: 100% Service Level
- 延迟: 3670ms Latency
- 测试状态: N/A Test
定价计划
- BASIC: $0.00 / mo
- PRO: $6.99 / mo
- ULTRA: $14.99 / mo
- MEGA: $79.99 / mo
功能描述
该 API 使用先进的 AI 模型,自动从图像中检测并高精度提取文本。无论是扫描文档、照片还是截图,API 都能将视觉文本转换为可编辑的、机器可读的内容,适用于数据处理、文档自动化和数字归档。出于隐私和安全考虑,文件从不存储;API 仅转换和处理每个图像的 Base64 编码版本,并将其发送到模型进行解析。
主要特性
- 接受图像和 PDF 上传(JPG、PNG、PDF、GIF、BMP、WEBP)
- 通过 JSON 接受 base64 编码的文件
- 使用 AI 模型提取文本
- 检测提取文本的语言
- 返回结构化 JSON,包含提取的文本、文档类型、置信度和语言
API 使用
端点
POST https://ocr-text-extractor5.p.rapidapi.com/api/extract-text
请求类型
1. 文件上传 (multipart/form-data)
- Content-Type:
multipart/form-data - 字段名称:
file - 接受格式: JPEG, PNG, PDF, GIF, BMP, WEBP (最大 10MB)
2. JSON (base64)
- Content-Type:
application/json
响应示例
json { "message": "Text extracted successfully", "formatted": "Text with preserved line breaks and layout", "raw": "Text without any special formatting or line breaks", "documentType": "receipt", "confidence": "high", "detectedLanguage": "en", "characterCount": 123 }
响应字段说明
formatted: 保留布局的提取文本raw: 无格式文本documentType: 检测到的文档类型confidence: 文档类型的置信度detectedLanguage: 检测到的语言的 ISO 代码characterCount: 原始文本中的字符数
搜集汇总
数据集介绍

背景与挑战
背景概述
OCR Text Extractor数据集用于从图像、文档及其他媒体中提取文本信息。它专注于实现文本内容的自动化提取功能。
以上内容由遇见数据集搜集并总结生成



