five

tsabar/donut_check

收藏
Hugging Face2022-12-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tsabar/donut_check
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为donut_check,包含图像和标签两个特征。标签是一个分类标签,包含16个类别,如信件、表格、电子邮件、手写体、广告、科学报告、科学出版物、规格说明、文件夹、新闻文章、预算、发票、演示文稿、问卷、简历和备忘录。数据集分为训练集和测试集,每个集包含160个样本。数据集总大小为38890167.568字节,下载大小为0。

--- 数据集信息: 特征: - 名称: 图像(image) 数据类型: 图像(image) - 名称: 标签(label) 数据类型: 分类标签(class_label): 类别名称: '0': 信件(letter) '1': 表单(form) '2': 电子邮件(email) '3': 手写文本(handwritten) '4': 广告(advertisement) '5': 科学报告(scientific report) '6': 科学出版物(scientific publication) '7': 规格说明书(specification) '8': 文件夹(file folder) '9': 新闻文章(news article) '10': 预算文档(budget) '11': 发票(invoice) '12': 演示文稿(presentation) '13': 调查问卷(questionnaire) '14': 简历(resume) '15': 备忘录(memo) 数据划分: - 名称: 训练集(train) 字节占用量: 19445096.284 样本数量: 160 - 名称: 测试集(test) 字节占用量: 19445071.284 样本数量: 160 下载大小: 0 数据集总大小: 38890167.568 --- # “donut_check”数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
tsabar
原始信息汇总

数据集概述

数据集特征

  • image
    • 数据类型: image
  • label
    • 数据类型: class_label
    • 类别名称:
      • 0: letter
      • 1: form
      • 2: email
      • 3: handwritten
      • 4: advertisement
      • 5: scientific report
      • 6: scientific publication
      • 7: specification
      • 8: file folder
      • 9: news article
      • 10: budget
      • 11: invoice
      • 12: presentation
      • 13: questionnaire
      • 14: resume
      • 15: memo

数据集分割

  • train
    • 数据量: 19445096.284 bytes
    • 示例数量: 160
  • test
    • 数据量: 19445071.284 bytes
    • 示例数量: 160

数据集大小

  • 下载大小: 0 bytes
  • 数据集总大小: 38890167.568 bytes
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作