TextOCR

Name: TextOCR
Creator: OpenDataLab
License: 暂无描述

OpenXLab2026-04-18 收录

下载链接：

https://openxlab.org.cn/datasets/OpenDataLab/TextOCR

下载链接

链接失效反馈

官方服务：

资源简介：

TextOCR 是一个数据集，用于在任意形状的场景文本上对文本识别进行基准测试。 TextOCR 要求模型对自然图像上存在的任意形状的场景文本执行文本识别。 TextOCR 在 TextVQA 图像上提供约 100 万个高质量的单词注释，允许将端到端推理应用于下游任务，例如视觉问答或图像字幕。数据集统计：来自 TextVQA 的 28,134 张自然图像 903,069 个带注释的场景文本字每张图像平均 32 个字

提供机构：

OpenDataLab

创建时间：

2022-05-24

5,000+

优质数据集

54 个

任务类型

进入经典数据集