OCR

RapidAPI2026-04-22 更新2024-05-01 收录

下载链接：

https://rapidapi.com/api4ai-api4ai-default/api/ocr43

下载链接

链接失效反馈

官方服务：

资源简介：

Optical Character Recognition: Automatically Detect and Recognize Text in Multiple Languages

创建时间：

2026-04-22

原始信息汇总

OCR API 数据集概述

基本信息

API名称: OCR
提供方: API4AI
类别: 视觉识别 / OCR
当前版本: v1
服务等级: 100%
延迟: 5344ms
流行度: 9.8

订阅计划

BASIC: $0.00 / 月
PRO: $39.00 / 月
ULTRA: $169.00 / 月
MEGA: $1299.00 / 月

核心功能

提供图像中光学字符识别的完整解决方案。
支持数十种语言，包括拉丁语、西里尔语、日语、中文和阿拉伯语等现代和古代文字。
提供两种识别模式：查找单独的单词或提取图像中的整个文本。
支持多页PDF文件。
支持两种传递图像的方式：作为二进制文件或通过公共资源的URL。

端点

方法	URL	描述
GET	`https://ocr43.p.rapidapi.com/v1/version`	获取服务版本。
GET	`https://ocr43.p.rapidapi.com/v1/algos`	获取算法列表。
POST	`https://ocr43.p.rapidapi.com/v1/results`	对常规图像执行OCR并获取结果。
POST	`https://ocr43.p.rapidapi.com/v1/vin/results`	对包含车辆识别码（VIN）的图像执行OCR并获取结果。

输入规范

支持的文件格式: JPEG、PNG、PDF。
支持的MIME类型: image/jpeg、image/png、application/pdf。
图像文件大小: 必须小于16MB。
最大分辨率: 4096x4096。
请求大小限制: 约32MB。

算法

simple-text（默认）：将图片/页面中的所有文本作为单个块提取。
simple-words：分别查找每个单词。

响应结构

通用OCR响应 (`v1/results`)

主要字段包括状态码、图像名称、MD5、页面、宽度、高度以及检测到的文本块数组。
每个文本块包含边界框坐标（归一化坐标）和识别的文本内容。

VIN识别响应 (`v1/vin/results`)

主要字段包括状态码、图像名称、MD5、页面、宽度、高度以及建议的VIN字符串数组。
在VIN可见度差的情况下，可能返回多个符合校验和规则的VIN建议。

演示与示例

Web演示: https://api4.ai/apis/ocr
Telegram演示机器人: https://t.me/a4a_ocr_bot
代码示例: https://gitlab.com/api4ai/examples/ocr

联系信息

邮箱: hello@api4.ai
Telegram: https://t.me/a4a_support_bot
Instagram: https://www.instagram.com/api4ai
Twitter: https://twitter.com/api4ai
Facebook: https://www.facebook.com/api4ai.solution

错误处理

图像无法处理: 返回状态码200，结果中状态码为failure，并包含相关解释。
请求过大: 返回状态码413。
缺少图像: 返回状态码422。

搜集汇总

数据集介绍

背景与挑战

背景概述

该OCR数据集是一个光学字符识别API服务，能够从图像或PDF中检测和识别文本，支持包括拉丁语、西里尔语、日语、中文和阿拉伯语在内的多种语言。它提供两种识别模式：提取整体文本或分离单词，并包含专用端点用于车辆识别码（VIN）的识别，返回结果以JSON格式呈现，便于集成到计算机视觉应用中。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

OCR