TextOCR
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/TextOCR
下载链接
链接失效反馈官方服务:
资源简介:
TextOCR 是一个数据集,用于在任意形状的场景文本上对文本识别进行基准测试。 TextOCR 要求模型对自然图像上存在的任意形状的场景文本执行文本识别。 TextOCR 在 TextVQA 图像上提供约 100 万个高质量的单词注释,允许将端到端推理应用于下游任务,例如视觉问答或图像字幕。数据集统计:来自 TextVQA 的 28,134 张自然图像 903,069 个带注释的场景文本字 每张图像平均 32 个字
提供机构:
OpenDataLab
创建时间:
2022-05-24



