MJSynth (Syn90k)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MJSynth_Syn90k
下载链接
链接失效反馈官方服务:
资源简介:
合成词数据集是综合生成的数据集,我们发现它足以训练现实世界图像上的文本识别。该数据集由覆盖90k英语单词的900万图像组成,包括我们工作中使用的训练、验证和测试拆分。
The Synthetic Word Dataset is a synthetically generated dataset, which we have found to be sufficient for training text recognition models on real-world images. This dataset consists of 9 million images covering 90,000 English words, and includes the training, validation, and test splits used in our work.
提供机构:
OpenDataLab
创建时间:
2023-01-05
搜集汇总
数据集介绍

背景与挑战
背景概述
MJSynth (Syn90k)是由牛津大学2014年发布的合成词数据集,包含900万张覆盖9万英语单词的图像,用于文本识别模型的训练和评估。数据集已划分训练、验证和测试集。
以上内容由遇见数据集搜集并总结生成



