five

priyank-m/MJSynth_text_recognition

收藏
Hugging Face2023-07-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/priyank-m/MJSynth_text_recognition
下载链接
链接失效反馈
官方服务:
资源简介:
MJSynth数据集是一个用于文档图像上文本识别的合成数据集,覆盖了90K个英语单词。它包括训练、验证和测试分割。数据集的特征包括图像和标签,任务类别为图像到文本,语言为英语,规模类别为1M到10M之间。

MJSynth数据集是一个用于文档图像上文本识别的合成数据集,覆盖了90K个英语单词。它包括训练、验证和测试分割。数据集的特征包括图像和标签,任务类别为图像到文本,语言为英语,规模类别为1M到10M之间。
提供机构:
priyank-m
原始信息汇总

数据集概述

数据集名称

  • MJSynth

数据集用途

  • 文本识别

数据集特征

  • 特征名称及类型
    • image:图像类型
    • label:字符串类型

数据集分割

  • 训练集
    • 示例数量:7224600
    • 数据大小:12173747703 字节
  • 验证集
    • 示例数量:802733
    • 数据大小:1352108669.283 字节
  • 测试集
    • 示例数量:891924
    • 数据大小:1484450563.896 字节

数据集大小

  • 下载大小:12115256620 字节
  • 数据集总大小:15010306936.179 字节

数据集语言

  • 英语

数据集规模

  • 1M<n<10M

数据集来源

  • https://www.robots.ox.ac.uk/~vgg/data/text/
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作