MJSynth_Syn90k
收藏魔搭社区2025-09-28 更新2025-03-01 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/MJSynth_Syn90k
下载链接
链接失效反馈官方服务:
资源简介:
displayName: MJSynth (Syn90k)
labelTypes:
- Text
license:
- Unknown
mediaTypes:
- Image
paperUrl: https://arxiv.org/pdf/1406.2227.pdf
publishDate: "2014"
publishUrl: https://www.robots.ox.ac.uk/~vgg/data/text/
publisher:
- University of Oxford
tags:
- Text
taskTypes:
- OCR
---
# 数据集介绍
## 简介
合成词数据集是综合生成的数据集,我们发现它足以训练现实世界图像上的文本识别。该数据集由覆盖90k英语单词的900万图像组成,包括我们工作中使用的训练、验证和测试拆分。
## Download dataset
:modelscope-code[]{type="git"}
displayName: MJSynth(Syn90k)
labelTypes:
- 文本
license:
- 未知
mediaTypes:
- 图像
paperUrl: https://arxiv.org/pdf/1406.2227.pdf
publishDate: "2014"
publishUrl: https://www.robots.ox.ac.uk/~vgg/data/text/
publisher:
- 牛津大学(University of Oxford)
tags:
- 文本
taskTypes:
- 光学字符识别(OCR)
---
# 数据集介绍
## 数据集简介
本数据集为合成生成型文本数据集,经实证可有效支撑真实场景图像的文本识别模型训练。该数据集共包含900万幅图像,覆盖9万个英语单词,并包含本研究所用的训练、验证与测试划分子集。
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-12



