five

MJSynth (Syn90k)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MJSynth_Syn90k
下载链接
链接失效反馈
官方服务:
资源简介:
合成词数据集是综合生成的数据集,我们发现它足以训练现实世界图像上的文本识别。该数据集由覆盖90k英语单词的900万图像组成,包括我们工作中使用的训练、验证和测试拆分。

The Synthetic Word Dataset is a synthetically generated dataset, which we have found to be sufficient for training text recognition models on real-world images. This dataset consists of 9 million images covering 90,000 English words, and includes the training, validation, and test splits used in our work.
提供机构:
OpenDataLab
创建时间:
2023-01-05
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MJSynth (Syn90k)是由牛津大学2014年发布的合成词数据集,包含900万张覆盖9万英语单词的图像,用于文本识别模型的训练和评估。数据集已划分训练、验证和测试集。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作