chainyo/rvl-cdip-questionnaire
收藏Hugging Face2022-04-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chainyo/rvl-cdip-questionnaire
下载链接
链接失效反馈官方服务:
资源简介:
RVL-CDIP(Ryerson Vision Lab Complex Document Information Processing)数据集包含400,000张灰度图像,分为16个类别,每个类别有25,000张图像。数据集分为320,000张训练图像、40,000张验证图像和40,000张测试图像。图像的尺寸限制为其最大维度不超过1000像素。此README文件描述的是原始数据集的一个子集,仅包含`questionnaire`类别的数据。
提供机构:
chainyo
原始信息汇总
数据集概述
数据集名称
RVL-CDIP (Ryerson Vision Lab Complex Document Information Processing)
数据集内容
- 包含400,000张灰度图像,分为16个类别,每个类别有25,000张图像。
- 图像尺寸:最大维度不超过1000像素。
数据集划分
- 训练集:320,000张图像
- 验证集:40,000张图像
- 测试集:40,000张图像
类别标签
0: letter
1: form
2: email
3: handwritten
4: advertissement
5: scientific report
6: scientific publication
7: specification
8: file folder
9: news article
10: budget
11: invoice
12: presentation
13: questionnaire
14: resume
15: memo
许可证
数据集为IIT-CDIP的子集,源自Legacy Tobacco Document Library,具体许可证信息可参考此处。
引用信息
- 来源论文:A. W. Harley, A. Ufkes, K. G. Derpanis, "Evaluation of Deep Convolutional Nets for Document Image Classification and Retrieval," in ICDAR, 2015



