VictorG-028/Small_subset_of_Synthetic_Word_Dataset
收藏Hugging Face2024-01-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/VictorG-028/Small_subset_of_Synthetic_Word_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
license: unknown
language:
- en
task_categories:
- image-to-text
tags:
- code
pretty_name: mjsynth
size_categories:
- 10K<n<100K
---
This dataset contains:
- 40351 images (71.39%) in train dataset
- 6378 images (14.29%) in validation dataset
- 6391 images (14.32%) in test dataset
- Total: 53120 images
- sourced from the extensive Synthetic Word Dataset, a large-scale word-image dataset.
The original and complete dataset (9 million images, 10.68GB) can be found and downloaded at [this academic torrent](https://academictorrents.com/details/3d0b4f09080703d2a9c6be50715b46389fdb3af1).
提供机构:
VictorG-028
原始信息汇总
数据集概述
基本信息
- 许可证: 未知
- 语言: 英语
- 任务类别: 图像到文本
- 标签: 代码
- 易读名称: mjsynth
- 大小类别: 10K<n<100K
数据集内容
- 训练集: 40351张图像 (71.39%)
- 验证集: 6378张图像 (14.29%)
- 测试集: 6391张图像 (14.32%)
- 总计: 53120张图像
- 来源: 广泛合成词数据集,一个大规模的词图像数据集
原始数据集
- 原始数据集: 900万张图像,10.68GB
- 下载链接: 学术种子链接



