Francesco/document-parts
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Francesco/document-parts
下载链接
链接失效反馈官方服务:
资源简介:
document-parts数据集是一个用于对象检测任务的数据集,包含图像及其对象的注释信息。每张图像都有对应的图像ID、图像、宽度、高度以及对象的ID、区域、边界框和类别信息。数据集由Roboflow用户通过众包方式创建,语言为英语,数据集大小在1K到10K之间。
提供机构:
Francesco
原始信息汇总
数据集概述
数据集名称
document-parts
数据集特征
- image_id: 整数类型 (int64)
- image: 图像类型
- width: 整数类型 (int32)
- height: 整数类型 (int32)
- objects: 序列类型,包含以下子特征:
- id: 整数类型 (int64)
- area: 整数类型 (int64)
- bbox: 序列类型,长度为4,浮点数类型 (float32)
- category: 类别标签,包含以下名称:
- 0: document-parts
- 1: table
- 2: title
数据集结构
- 数据实例: 每个数据点包括一张图片及其对象标注。
- 数据字段:
- image: 图片对象,自动解码。
- width: 图片宽度。
- height: 图片高度。
- objects: 包含对象的元数据,包括id、area、bbox和category。
数据集用途
- 任务类别: 对象检测
- 支持的任务: 用于训练对象检测模型。
数据集详情
- 语言: 英语
- 许可证: cc
- 多语言性: 单语种
- 大小类别: 1K<n<10K
- 来源: 原始数据集
- 注释创建者: 众包
- 语言创建者: 发现
数据集示例
{ image_id: 15, image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>, width: 964043, height: 640, objects: { id: [114, 115, 116, 117], area: [3796, 1596, 152768, 81002], bbox: [ [302.0, 109.0, 73.0, 52.0], [810.0, 100.0, 57.0, 28.0], [160.0, 31.0, 248.0, 616.0], [741.0, 68.0, 202.0, 401.0] ], category: [4, 4, 0, 0] } }



