OCR
收藏RapidAPI2026-04-22 更新2024-05-01 收录
下载链接:
https://rapidapi.com/api4ai-api4ai-default/api/ocr43
下载链接
链接失效反馈官方服务:
资源简介:
Optical Character Recognition: Automatically Detect and Recognize Text in Multiple Languages
创建时间:
2026-04-22
原始信息汇总
OCR API 数据集概述
基本信息
- API名称: OCR
- 提供方: API4AI
- 类别: 视觉识别 / OCR
- 当前版本: v1
- 服务等级: 100%
- 延迟: 5344ms
- 流行度: 9.8
订阅计划
- BASIC: $0.00 / 月
- PRO: $39.00 / 月
- ULTRA: $169.00 / 月
- MEGA: $1299.00 / 月
核心功能
- 提供图像中光学字符识别的完整解决方案。
- 支持数十种语言,包括拉丁语、西里尔语、日语、中文和阿拉伯语等现代和古代文字。
- 提供两种识别模式:查找单独的单词或提取图像中的整个文本。
- 支持多页PDF文件。
- 支持两种传递图像的方式:作为二进制文件或通过公共资源的URL。
端点
| 方法 | URL | 描述 |
|---|---|---|
| GET | https://ocr43.p.rapidapi.com/v1/version |
获取服务版本。 |
| GET | https://ocr43.p.rapidapi.com/v1/algos |
获取算法列表。 |
| POST | https://ocr43.p.rapidapi.com/v1/results |
对常规图像执行OCR并获取结果。 |
| POST | https://ocr43.p.rapidapi.com/v1/vin/results |
对包含车辆识别码(VIN)的图像执行OCR并获取结果。 |
输入规范
- 支持的文件格式: JPEG、PNG、PDF。
- 支持的MIME类型:
image/jpeg、image/png、application/pdf。 - 图像文件大小: 必须小于16MB。
- 最大分辨率: 4096x4096。
- 请求大小限制: 约32MB。
算法
simple-text(默认):将图片/页面中的所有文本作为单个块提取。simple-words:分别查找每个单词。
响应结构
通用OCR响应 (v1/results)
- 主要字段包括状态码、图像名称、MD5、页面、宽度、高度以及检测到的文本块数组。
- 每个文本块包含边界框坐标(归一化坐标)和识别的文本内容。
VIN识别响应 (v1/vin/results)
- 主要字段包括状态码、图像名称、MD5、页面、宽度、高度以及建议的VIN字符串数组。
- 在VIN可见度差的情况下,可能返回多个符合校验和规则的VIN建议。
演示与示例
- Web演示: https://api4.ai/apis/ocr
- Telegram演示机器人: https://t.me/a4a_ocr_bot
- 代码示例: https://gitlab.com/api4ai/examples/ocr
联系信息
- 邮箱: hello@api4.ai
- Telegram: https://t.me/a4a_support_bot
- Instagram: https://www.instagram.com/api4ai
- Twitter: https://twitter.com/api4ai
- Facebook: https://www.facebook.com/api4ai.solution
错误处理
- 图像无法处理: 返回状态码
200,结果中状态码为failure,并包含相关解释。 - 请求过大: 返回状态码
413。 - 缺少图像: 返回状态码
422。
搜集汇总
数据集介绍

背景与挑战
背景概述
该OCR数据集是一个光学字符识别API服务,能够从图像或PDF中检测和识别文本,支持包括拉丁语、西里尔语、日语、中文和阿拉伯语在内的多种语言。它提供两种识别模式:提取整体文本或分离单词,并包含专用端点用于车辆识别码(VIN)的识别,返回结果以JSON格式呈现,便于集成到计算机视觉应用中。
以上内容由遇见数据集搜集并总结生成



