five

OCR Text Extractor

收藏
RapidAPI2025-12-05 更新2025-12-03 收录
下载链接:
https://rapidapi.com/apimatrix/api/ocr-text-extractor5
下载链接
链接失效反馈
官方服务:
资源简介:
Extract text from images, documents and other medias

从图像、文档及其他媒介中提取文本
创建时间:
2025-12-05
原始信息汇总

OCR Text Extractor 数据集概述

基本信息

  • 数据集名称: OCR Text Extractor
  • 提供平台: RapidAPI
  • API 版本: v1 (current)
  • 所属类别: Visual Recognition
  • API 创建者: ApiMatrixLabs
  • 订阅者数量: 4

性能与评级

  • 流行度: 8.8 Popularity
  • 服务等级: 100% Service Level
  • 延迟: 3670ms Latency
  • 测试状态: N/A Test

定价计划

  • BASIC: $0.00 / mo
  • PRO: $6.99 / mo
  • ULTRA: $14.99 / mo
  • MEGA: $79.99 / mo

功能描述

该 API 使用先进的 AI 模型,自动从图像中检测并高精度提取文本。无论是扫描文档、照片还是截图,API 都能将视觉文本转换为可编辑的、机器可读的内容,适用于数据处理、文档自动化和数字归档。出于隐私和安全考虑,文件从不存储;API 仅转换和处理每个图像的 Base64 编码版本,并将其发送到模型进行解析。

主要特性

  • 接受图像和 PDF 上传(JPG、PNG、PDF、GIF、BMP、WEBP)
  • 通过 JSON 接受 base64 编码的文件
  • 使用 AI 模型提取文本
  • 检测提取文本的语言
  • 返回结构化 JSON,包含提取的文本、文档类型、置信度和语言

API 使用

端点

POST https://ocr-text-extractor5.p.rapidapi.com/api/extract-text

请求类型

1. 文件上传 (multipart/form-data)

  • Content-Type: multipart/form-data
  • 字段名称: file
  • 接受格式: JPEG, PNG, PDF, GIF, BMP, WEBP (最大 10MB)

2. JSON (base64)

  • Content-Type: application/json

响应示例

json { "message": "Text extracted successfully", "formatted": "Text with preserved line breaks and layout", "raw": "Text without any special formatting or line breaks", "documentType": "receipt", "confidence": "high", "detectedLanguage": "en", "characterCount": 123 }

响应字段说明

  • formatted: 保留布局的提取文本
  • raw: 无格式文本
  • documentType: 检测到的文档类型
  • confidence: 文档类型的置信度
  • detectedLanguage: 检测到的语言的 ISO 代码
  • characterCount: 原始文本中的字符数
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
OCR Text Extractor数据集用于从图像、文档及其他媒体中提取文本信息。它专注于实现文本内容的自动化提取功能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作