Francesco/peanuts-sd4kf
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Francesco/peanuts-sd4kf
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image_id
dtype: int64
- name: image
dtype: image
- name: width
dtype: int32
- name: height
dtype: int32
- name: objects
sequence:
- name: id
dtype: int64
- name: area
dtype: int64
- name: bbox
sequence: float32
length: 4
- name: category
dtype:
class_label:
names:
'0': peanuts
'1': with mold
'2': without mold
annotations_creators:
- crowdsourced
language_creators:
- found
language:
- en
license:
- cc
multilinguality:
- monolingual
size_categories:
- 1K<n<10K
source_datasets:
- original
task_categories:
- object-detection
task_ids: []
pretty_name: peanuts-sd4kf
tags:
- rf100
---
# Dataset Card for peanuts-sd4kf
** The original COCO dataset is stored at `dataset.tar.gz`**
## Dataset Description
- **Homepage:** https://universe.roboflow.com/object-detection/peanuts-sd4kf
- **Point of Contact:** francesco.zuppichini@gmail.com
### Dataset Summary
peanuts-sd4kf
### Supported Tasks and Leaderboards
- `object-detection`: The dataset can be used to train a model for Object Detection.
### Languages
English
## Dataset Structure
### Data Instances
A data point comprises an image and its object annotations.
```
{
'image_id': 15,
'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>,
'width': 964043,
'height': 640,
'objects': {
'id': [114, 115, 116, 117],
'area': [3796, 1596, 152768, 81002],
'bbox': [
[302.0, 109.0, 73.0, 52.0],
[810.0, 100.0, 57.0, 28.0],
[160.0, 31.0, 248.0, 616.0],
[741.0, 68.0, 202.0, 401.0]
],
'category': [4, 4, 0, 0]
}
}
```
### Data Fields
- `image`: the image id
- `image`: `PIL.Image.Image` object containing the image. Note that when accessing the image column: `dataset[0]["image"]` the image file is automatically decoded. Decoding of a large number of image files might take a significant amount of time. Thus it is important to first query the sample index before the `"image"` column, *i.e.* `dataset[0]["image"]` should **always** be preferred over `dataset["image"][0]`
- `width`: the image width
- `height`: the image height
- `objects`: a dictionary containing bounding box metadata for the objects present on the image
- `id`: the annotation id
- `area`: the area of the bounding box
- `bbox`: the object's bounding box (in the [coco](https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco) format)
- `category`: the object's category.
#### Who are the annotators?
Annotators are Roboflow users
## Additional Information
### Licensing Information
See original homepage https://universe.roboflow.com/object-detection/peanuts-sd4kf
### Citation Information
```
@misc{ peanuts-sd4kf,
title = { peanuts sd4kf Dataset },
type = { Open Source Dataset },
author = { Roboflow 100 },
howpublished = { \url{ https://universe.roboflow.com/object-detection/peanuts-sd4kf } },
url = { https://universe.roboflow.com/object-detection/peanuts-sd4kf },
journal = { Roboflow Universe },
publisher = { Roboflow },
year = { 2022 },
month = { nov },
note = { visited on 2023-03-29 },
}"
```
### Contributions
Thanks to [@mariosasko](https://github.com/mariosasko) for adding this dataset.
dataset_info:
数据集信息:
特征:
- 名称:image_id,数据类型:int64(64位整数)
- 名称:image,数据类型:image(图像)
- 名称:width,数据类型:int32(32位整数)
- 名称:height,数据类型:int32(32位整数)
- 名称:objects,序列类型:
- 名称:id,数据类型:int64(64位整数)
- 名称:area,数据类型:int64(64位整数)
- 名称:bbox,序列类型:float32(32位浮点数),长度为4
- 名称:category,数据类型:
类别标签:
名称映射:
'0': 花生(peanuts)
'1': 带霉变(with mold)
'2': 无霉变(without mold)
标注创建者:
- 众包(crowdsourced)
语言创建者:
- 现成采集(found)
语言:
- 英语(en)
许可证:
- CC(知识共享协议)
多语言类型:
- 单语言(monolingual)
样本规模区间:
- 1K<n<10K(样本量介于1000至10000之间)
源数据集:
- 原创数据集(original)
任务类别:
- 目标检测(object-detection)
任务子项:[]
友好名称:peanuts-sd4kf
标签:
- rf100
# 花生-sd4kf 数据集卡片
**原始COCO数据集存储于`dataset.tar.gz`**
## 数据集说明
- **主页**:https://universe.roboflow.com/object-detection/peanuts-sd4kf
- **联系人**:francesco.zuppichini@gmail.com
### 数据集概述
peanuts-sd4kf
### 支持任务与排行榜
- `目标检测(object-detection)`:本数据集可用于训练目标检测模型。
### 语言
英语
## 数据集结构
### 数据实例
单个数据样本包含图像及其目标标注信息。
{
'image_id': 15,
'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>,
'width': 964043,
'height': 640,
'objects': {
'id': [114, 115, 116, 117],
'area': [3796, 1596, 152768, 81002],
'bbox': [
[302.0, 109.0, 73.0, 52.0],
[810.0, 100.0, 57.0, 28.0],
[160.0, 31.0, 248.0, 616.0],
[741.0, 68.0, 202.0, 401.0]
],
'category': [4, 4, 0, 0]
}
}
### 数据字段
- `image_id`:图像唯一标识符
- `image`:包含图像的`PIL.Image.Image`对象。请注意,访问图像列时,`dataset[0]["image"]`会自动解码图像文件。解码大量图像文件会耗费较长时间,因此建议始终优先通过样本索引访问图像列,即推荐使用`dataset[0]["image"]`而非`dataset["image"][0]`。
- `width`:图像宽度
- `height`:图像高度
- `objects`:包含图像中目标边界框元数据的字典
- `id`:标注ID
- `area`:边界框面积
- `bbox`:目标边界框,采用[COCO](https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco)格式
- `category`:目标类别。
#### 标注人员构成
标注人员为Roboflow平台用户。
## 附加信息
### 许可信息
详见原主页:https://universe.roboflow.com/object-detection/peanuts-sd4kf
### 引用信息
@misc{ peanuts-sd4kf,
title = { 花生-sd4kf 数据集 },
type = { 开源数据集 },
author = { Roboflow 100 },
howpublished = { \url{ https://universe.roboflow.com/object-detection/peanuts-sd4kf } },
url = { https://universe.roboflow.com/object-detection/peanuts-sd4kf },
journal = { Roboflow Universe },
publisher = { Roboflow },
year = { 2022 },
month = { 11月 },
note = { 访问于 2023-03-29 },
}
### 贡献
感谢[@mariosasko](https://github.com/mariosasko)为本数据集的添加工作。
提供机构:
Francesco
原始信息汇总
数据集概述:peanuts-sd4kf
数据集描述
- 数据集名称: peanuts-sd4kf
- 任务类型: 对象检测(Object-Detection)
- 语言: 英语(English)
- 许可证: cc
数据集结构
数据特征
- image_id: 整数类型(int64)
- image: 图像类型
- width: 整数类型(int32)
- height: 整数类型(int32)
- objects: 序列类型,包含以下子特征:
- id: 整数类型(int64)
- area: 整数类型(int64)
- bbox: 浮点数序列类型(float32),长度为4
- category: 类别标签,包含以下名称:
- 0: peanuts
- 1: with mold
- 2: without mold
数据实例
每个数据点包括一张图像及其对象注释。示例数据结构如下:
json { image_id: 15, image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>, width: 964043, height: 640, objects: { id: [114, 115, 116, 117], area: [3796, 1596, 152768, 81002], bbox: [ [302.0, 109.0, 73.0, 52.0], [810.0, 100.0, 57.0, 28.0], [160.0, 31.0, 248.0, 616.0], [741.0, 68.0, 202.0, 401.0] ], category: [4, 4, 0, 0] } }
数据字段
- image: 图像ID
- image:
PIL.Image.Image对象,包含图像数据 - width: 图像宽度
- height: 图像高度
- objects: 包含对象的元数据,包括ID、面积、边界框和类别
数据集贡献者
- 贡献者:@mariosasko
搜集汇总
数据集介绍

构建方式
Francesco/peanuts-sd4kf数据集的构建,依托于Roboflow平台,以图像及其对象标注为核心,涵盖图像识别领域常用的数据字段。该数据集由Roboflow用户群体协作标注,采用众包模式进行数据标注,确保了数据标注的多样性和准确性。数据集包含图像ID、图像本身、宽度、高度以及对象信息,其中对象信息包括ID、面积、边界框和类别,类别分为花生、带霉花生和无霉花生三种,以满足对象检测任务的需求。
特点
该数据集具有以下显著特点:一是专注于花生及其霉变状态的对象检测任务,具有较高的领域专业性;二是数据集规模适中,便于模型训练与测试;三是数据标注质量较高,众包模式确保了数据的多元性和可用性;四是遵循CC协议,保证了数据的使用自由度。
使用方法
使用Francesco/peanuts-sd4kf数据集时,用户首先需要访问数据集的主页以获取数据集的详细信息。数据集以压缩文件形式存储,用户需解压后获取数据。数据集支持对象检测任务,用户可以使用Python的PIL库来处理图像字段。在访问图像时,建议先查询样本索引,避免解码大量图像文件所耗费的时间。数据集的使用遵循相应的许可协议,用户需遵守相关规定。
背景与挑战
背景概述
peanuts-sd4kf数据集,起源于Roboflow平台,旨在为对象检测任务提供专业的数据支持。该数据集由Roboflow用户共同标注,其核心研究问题聚焦于花生及其表观的分类,包括正常花生、带有霉变的花生和无霉变的花生。自2022年11月发布以来,该数据集以其独特的分类需求和对农业自动化领域的潜在贡献,引起了广泛关注,成为相关研究的重要资源。
当前挑战
在数据集构建过程中,研究者们面临了如何准确标注花生及其霉变状态的挑战。此外,数据集在解决对象检测任务时,也需克服识别精度、实时性以及在不同环境条件下的一致性问题。在数据标注质量、数据多样性和数据规模等方面,peanuts-sd4kf数据集同样面临持续的优化和扩展需求。
常用场景
经典使用场景
在计算机视觉的研究领域,Francesco/peanuts-sd4kf数据集被广泛用于对象检测任务。该数据集包含了带有花生及其是否发霉的标注图片,其结构化的数据格式使得研究者能够轻松地训练和测试对象检测模型,进而提高模型的识别准确性。
解决学术问题
该数据集解决了对象检测中细粒度分类的难题,尤其是对于花生是否发霉的区分,有助于提升学术研究中对图像内容理解的深度和精确度。其多样化的图像和标注信息,为学术研究提供了丰富的实验素材,进而推动了相关领域的发展。
衍生相关工作
基于Francesco/peanuts-sd4kf数据集的研究成果,已衍生出多项相关工作,包括改进的对象检测算法、图像分割技术以及针对特定农业产品的质量评估系统,这些研究进一步扩展了数据集的应用范围,并促进了相关技术的进步。
以上内容由遇见数据集搜集并总结生成



