tsabar/donut_check
收藏Hugging Face2022-12-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tsabar/donut_check
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为donut_check,包含图像和标签两个特征。标签是一个分类标签,包含16个类别,如信件、表格、电子邮件、手写体、广告、科学报告、科学出版物、规格说明、文件夹、新闻文章、预算、发票、演示文稿、问卷、简历和备忘录。数据集分为训练集和测试集,每个集包含160个样本。数据集总大小为38890167.568字节,下载大小为0。
---
数据集信息:
特征:
- 名称: 图像(image)
数据类型: 图像(image)
- 名称: 标签(label)
数据类型:
分类标签(class_label):
类别名称:
'0': 信件(letter)
'1': 表单(form)
'2': 电子邮件(email)
'3': 手写文本(handwritten)
'4': 广告(advertisement)
'5': 科学报告(scientific report)
'6': 科学出版物(scientific publication)
'7': 规格说明书(specification)
'8': 文件夹(file folder)
'9': 新闻文章(news article)
'10': 预算文档(budget)
'11': 发票(invoice)
'12': 演示文稿(presentation)
'13': 调查问卷(questionnaire)
'14': 简历(resume)
'15': 备忘录(memo)
数据划分:
- 名称: 训练集(train)
字节占用量: 19445096.284
样本数量: 160
- 名称: 测试集(test)
字节占用量: 19445071.284
样本数量: 160
下载大小: 0
数据集总大小: 38890167.568
---
# “donut_check”数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
tsabar
原始信息汇总
数据集概述
数据集特征
- image
- 数据类型: image
- label
- 数据类型: class_label
- 类别名称:
- 0: letter
- 1: form
- 2: email
- 3: handwritten
- 4: advertisement
- 5: scientific report
- 6: scientific publication
- 7: specification
- 8: file folder
- 9: news article
- 10: budget
- 11: invoice
- 12: presentation
- 13: questionnaire
- 14: resume
- 15: memo
数据集分割
- train
- 数据量: 19445096.284 bytes
- 示例数量: 160
- test
- 数据量: 19445071.284 bytes
- 示例数量: 160
数据集大小
- 下载大小: 0 bytes
- 数据集总大小: 38890167.568 bytes



