priyank-m/MJSynth_text_recognition
收藏Hugging Face2023-07-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/priyank-m/MJSynth_text_recognition
下载链接
链接失效反馈官方服务:
资源简介:
MJSynth数据集是一个用于文档图像上文本识别的合成数据集,覆盖了90K个英语单词。它包括训练、验证和测试分割。数据集的特征包括图像和标签,任务类别为图像到文本,语言为英语,规模类别为1M到10M之间。
MJSynth数据集是一个用于文档图像上文本识别的合成数据集,覆盖了90K个英语单词。它包括训练、验证和测试分割。数据集的特征包括图像和标签,任务类别为图像到文本,语言为英语,规模类别为1M到10M之间。
提供机构:
priyank-m
原始信息汇总
数据集概述
数据集名称
- MJSynth
数据集用途
- 文本识别
数据集特征
- 特征名称及类型
image:图像类型label:字符串类型
数据集分割
- 训练集
- 示例数量:7224600
- 数据大小:12173747703 字节
- 验证集
- 示例数量:802733
- 数据大小:1352108669.283 字节
- 测试集
- 示例数量:891924
- 数据大小:1484450563.896 字节
数据集大小
- 下载大小:12115256620 字节
- 数据集总大小:15010306936.179 字节
数据集语言
- 英语
数据集规模
- 1M<n<10M
数据集来源
- https://www.robots.ox.ac.uk/~vgg/data/text/



