five

Francesco/document-parts

收藏
Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Francesco/document-parts
下载链接
链接失效反馈
官方服务:
资源简介:
document-parts数据集是一个用于对象检测任务的数据集,包含图像及其对象的注释信息。每张图像都有对应的图像ID、图像、宽度、高度以及对象的ID、区域、边界框和类别信息。数据集由Roboflow用户通过众包方式创建,语言为英语,数据集大小在1K到10K之间。
提供机构:
Francesco
原始信息汇总

数据集概述

数据集名称

document-parts

数据集特征

  • image_id: 整数类型 (int64)
  • image: 图像类型
  • width: 整数类型 (int32)
  • height: 整数类型 (int32)
  • objects: 序列类型,包含以下子特征:
    • id: 整数类型 (int64)
    • area: 整数类型 (int64)
    • bbox: 序列类型,长度为4,浮点数类型 (float32)
    • category: 类别标签,包含以下名称:
      • 0: document-parts
      • 1: table
      • 2: title

数据集结构

  • 数据实例: 每个数据点包括一张图片及其对象标注。
  • 数据字段:
    • image: 图片对象,自动解码。
    • width: 图片宽度。
    • height: 图片高度。
    • objects: 包含对象的元数据,包括id、area、bbox和category。

数据集用途

  • 任务类别: 对象检测
  • 支持的任务: 用于训练对象检测模型。

数据集详情

  • 语言: 英语
  • 许可证: cc
  • 多语言性: 单语种
  • 大小类别: 1K<n<10K
  • 来源: 原始数据集
  • 注释创建者: 众包
  • 语言创建者: 发现

数据集示例

{ image_id: 15, image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>, width: 964043, height: 640, objects: { id: [114, 115, 116, 117], area: [3796, 1596, 152768, 81002], bbox: [ [302.0, 109.0, 73.0, 52.0], [810.0, 100.0, 57.0, 28.0], [160.0, 31.0, 248.0, 616.0], [741.0, 68.0, 202.0, 401.0] ], category: [4, 4, 0, 0] } }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作