five

chainyo/rvl-cdip-questionnaire

收藏
Hugging Face2022-04-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chainyo/rvl-cdip-questionnaire
下载链接
链接失效反馈
官方服务:
资源简介:
RVL-CDIP(Ryerson Vision Lab Complex Document Information Processing)数据集包含400,000张灰度图像,分为16个类别,每个类别有25,000张图像。数据集分为320,000张训练图像、40,000张验证图像和40,000张测试图像。图像的尺寸限制为其最大维度不超过1000像素。此README文件描述的是原始数据集的一个子集,仅包含`questionnaire`类别的数据。
提供机构:
chainyo
原始信息汇总

数据集概述

数据集名称

RVL-CDIP (Ryerson Vision Lab Complex Document Information Processing)

数据集内容

  • 包含400,000张灰度图像,分为16个类别,每个类别有25,000张图像。
  • 图像尺寸:最大维度不超过1000像素。

数据集划分

  • 训练集:320,000张图像
  • 验证集:40,000张图像
  • 测试集:40,000张图像

类别标签

0: letter
1: form
2: email
3: handwritten
4: advertissement
5: scientific report
6: scientific publication
7: specification
8: file folder
9: news article
10: budget
11: invoice
12: presentation
13: questionnaire
14: resume
15: memo

许可证

数据集为IIT-CDIP的子集,源自Legacy Tobacco Document Library,具体许可证信息可参考此处

引用信息

  • 来源论文:A. W. Harley, A. Ufkes, K. G. Derpanis, "Evaluation of Deep Convolutional Nets for Document Image Classification and Retrieval," in ICDAR, 2015
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作