nateraw/beans
收藏Hugging Face2022-10-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nateraw/beans
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- expert-generated
language_creators:
- expert-generated
language:
- en
license:
- mit
multilinguality:
- monolingual
pretty_name: Beans
size_categories:
- 1K<n<10K
source_datasets:
- original
task_categories:
- other
task_ids:
- other-other-image-classification
---
# Dataset Card for Beans
## Table of Contents
- [Table of Contents](#table-of-contents)
- [Dataset Description](#dataset-description)
- [Dataset Summary](#dataset-summary)
- [Supported Tasks and Leaderboards](#supported-tasks-and-leaderboards)
- [Languages](#languages)
- [Dataset Structure](#dataset-structure)
- [Data Instances](#data-instances)
- [Data Fields](#data-fields)
- [Data Splits](#data-splits)
- [Dataset Creation](#dataset-creation)
- [Curation Rationale](#curation-rationale)
- [Source Data](#source-data)
- [Annotations](#annotations)
- [Personal and Sensitive Information](#personal-and-sensitive-information)
- [Considerations for Using the Data](#considerations-for-using-the-data)
- [Social Impact of Dataset](#social-impact-of-dataset)
- [Discussion of Biases](#discussion-of-biases)
- [Other Known Limitations](#other-known-limitations)
- [Additional Information](#additional-information)
- [Dataset Curators](#dataset-curators)
- [Licensing Information](#licensing-information)
- [Citation Information](#citation-information)
- [Contributions](#contributions)
## Dataset Description
- **Homepage:**[Beans Homepage](https://github.com/AI-Lab-Makerere/ibean/)
- **Repository:**[AI-Lab-Makerere/ibean](https://github.com/AI-Lab-Makerere/ibean/)
- **Paper:** N/A
- **Leaderboard:** N/A
- **Point of Contact:** N/A
### Dataset Summary
Beans leaf dataset with images of diseased and health leaves.
### Supported Tasks and Leaderboards
- image-classification
### Languages
English
## Dataset Structure
### Data Instances
A sample from the training set is provided below:
```
{
'image_file_path': '/root/.cache/huggingface/datasets/downloads/extracted/0aaa78294d4bf5114f58547e48d91b7826649919505379a167decb629aa92b0a/train/bean_rust/bean_rust_train.109.jpg',
'labels': 1
}
```
### Data Fields
The data instances have the following fields:
- `image_file_path`: a `string` filepath to an image.
- `labels`: an `int` classification label.
### Data Splits
| name |train|validation|test|
|----------|----:|----:|----:|
|beans|1034|133|128|
## Dataset Creation
### Curation Rationale
[More Information Needed]
### Source Data
#### Initial Data Collection and Normalization
[More Information Needed]
#### Who are the source language producers?
[More Information Needed]
### Annotations
#### Annotation process
[More Information Needed]
#### Who are the annotators?
[More Information Needed]
### Personal and Sensitive Information
[More Information Needed]
## Considerations for Using the Data
### Social Impact of Dataset
[More Information Needed]
### Discussion of Biases
[More Information Needed]
### Other Known Limitations
[More Information Needed]
## Additional Information
### Dataset Curators
[More Information Needed]
### Licensing Information
[More Information Needed]
### Citation Information
```
@ONLINE {beansdata,
author="Makerere AI Lab",
title="Bean disease dataset",
month="January",
year="2020",
url="https://github.com/AI-Lab-Makerere/ibean/"
}
```
### Contributions
Thanks to [@nateraw](https://github.com/nateraw) for adding this dataset.
annotations_creators:
- 专家生成
language_creators:
- 专家生成
language:
- 英语
license:
- MIT许可证
multilinguality:
- 单语言
pretty_name: Beans
size_categories:
- 1K<n<10K
source_datasets:
- 原始数据集
task_categories:
- 其他
task_ids:
- 其他-其他图像分类
---
# Beans 数据集卡片
## 目录
- [目录](#table-of-contents)
- [数据集描述](#dataset-description)
- [数据集概述](#dataset-summary)
- [支持任务与排行榜](#supported-tasks-and-leaderboards)
- [语言说明](#languages)
- [数据集结构](#dataset-structure)
- [数据实例](#data-instances)
- [数据字段](#data-fields)
- [数据划分](#data-splits)
- [数据集构建](#dataset-creation)
- [构建初衷](#curation-rationale)
- [源数据](#source-data)
- [注释说明](#annotations)
- [个人与敏感信息](#personal-and-sensitive-information)
- [数据使用注意事项](#considerations-for-using-the-data)
- [数据集的社会影响](#social-impact-of-dataset)
- [偏差讨论](#discussion-of-biases)
- [其他已知局限性](#other-known-limitations)
- [附加信息](#additional-information)
- [数据集策展人](#dataset-curators)
- [许可证信息](#licensing-information)
- [引用信息](#citation-information)
- [贡献致谢](#contributions)
## 数据集描述
- **"主页"**: [Beans 数据集主页](https://github.com/AI-Lab-Makerere/ibean/)
- **"代码仓库"**: [AI-Lab-Makerere/ibean](https://github.com/AI-Lab-Makerere/ibean/)
- **"论文"**: 无
- **"排行榜"**: 无
- **"联络人"**: 无
### 数据集概述
本数据集为Beans叶片数据集,涵盖染病与健康的豆类叶片图像。
### 支持任务与排行榜
- 图像分类
### 语言说明
英语
## 数据集结构
### 数据实例
以下提供了训练集的一个样本示例:
{
'image_file_path': '/root/.cache/huggingface/datasets/downloads/extracted/0aaa78294d4bf5114f58547e48d91b7826649919505379a167decb629aa92b0a/train/bean_rust/bean_rust_train.109.jpg',
'labels': 1
}
### 数据字段
数据实例包含以下字段:
- `image_file_path`: 字符串类型,指向图像的文件路径
- `labels`: 整数类型,分类标签
### 数据划分
| 数据集名称 | 训练集 | 验证集 | 测试集 |
|----------|----:|----:|----:|
| beans | 1034 | 133 | 128 |
## 数据集构建
### 构建初衷
[需要更多信息]
### 源数据
#### 初始数据收集与归一化
[需要更多信息]
#### 源语言生成者是谁?
[需要更多信息]
### 注释说明
#### 注释流程
[需要更多信息]
#### 注释人员是谁?
[需要更多信息]
### 个人与敏感信息
[需要更多信息]
## 数据使用注意事项
### 数据集的社会影响
[需要更多信息]
### 偏差讨论
[需要更多信息]
### 其他已知局限性
[需要更多信息]
## 附加信息
### 数据集策展人
[需要更多信息]
### 许可证信息
[需要更多信息]
### 引用信息
@ONLINE {beansdata,
author="Makerere AI Lab",
title="Bean disease dataset",
month="January",
year="2020",
url="https://github.com/AI-Lab-Makerere/ibean/"
}
### 贡献致谢
感谢 [@nateraw](https://github.com/nateraw) 为本数据集的收录提供支持。
提供机构:
nateraw
原始信息汇总
数据集概述
数据集基本信息
- 名称: Beans
- 语言: 英语
- 许可证: MIT
- 多语言性: 单语种
- 大小: 1K<n<10K
- 来源: 原始数据
- 任务类别: 其他
- 任务ID: other-other-image-classification
数据集描述
数据集摘要
Beans叶部数据集,包含病害和健康叶片的图像。
支持的任务和排行榜
- 图像分类
语言
- 英语
数据集结构
数据实例
{ image_file_path: /root/.cache/huggingface/datasets/downloads/extracted/0aaa78294d4bf5114f58547e48d91b7826649919505379a167decb629aa92b0a/train/bean_rust/bean_rust_train.109.jpg, labels: 1 }
数据字段
image_file_path: 字符串类型,图像文件路径。labels: 整数类型,分类标签。
数据分割
| 名称 | 训练 | 验证 | 测试 |
|---|---|---|---|
| beans | 1034 | 133 | 128 |
数据集创建
来源数据
- 初始数据收集和规范化: 需要更多信息
- 源语言生产者: 需要更多信息
注释
- 注释过程: 需要更多信息
- 注释者: 需要更多信息
个人和敏感信息
- 需要更多信息
使用数据的考虑
数据集的社会影响
- 需要更多信息
偏见讨论
- 需要更多信息
其他已知限制
- 需要更多信息
附加信息
数据集管理者
- 需要更多信息
许可证信息
- 需要更多信息
引用信息
@ONLINE {beansdata, author="Makerere AI Lab", title="Bean disease dataset", month="January", year="2020", url="https://github.com/AI-Lab-Makerere/ibean/" }
贡献者
- 感谢@nateraw添加此数据集。
搜集汇总
数据集介绍

构建方式
在农业病害识别领域,数据集的构建往往依赖于实地采集与专家标注。本数据集聚焦于豆类叶片病害,其构建过程涉及对健康与患病叶片图像的系统性收集。图像由专家进行标准化拍摄,确保光照、角度与背景的一致性,随后由领域专家对每张图像进行精确分类标注,形成涵盖锈病等典型病害类别的结构化数据。数据划分遵循机器学习常规实践,划分为训练集、验证集与测试集,为模型开发与评估提供了可靠基础。
特点
该数据集在植物病理学图像分析中展现出鲜明的特点。其核心在于提供了高质量的豆类叶片图像,涵盖健康与病害状态,图像分辨率与清晰度均经过严格控制,确保了视觉特征的可靠性。数据集规模适中,包含逾千张样本,平衡了模型训练的需求与数据管理的可行性。标签体系简洁明确,直接对应病害类别,便于分类任务的直接应用。作为单语(英语)数据集,其结构清晰,易于集成至主流深度学习框架,为农业人工智能研究提供了专项资源。
使用方法
在农业智能诊断应用中,该数据集主要用于图像分类模型的训练与验证。研究人员可通过加载数据集中预设的分割,直接使用训练集进行模型训练,利用验证集进行超参数调优,并通过测试集评估模型泛化性能。典型工作流程包括使用如TensorFlow或PyTorch等框架读取图像路径与对应标签,进行必要的图像预处理(如缩放、归一化),继而构建卷积神经网络进行分类学习。数据集的标准化格式确保了与常见机器学习工具链的无缝对接,支持从实验原型到实际部署的完整流程。
背景与挑战
背景概述
在农业科技与计算机视觉交叉领域,植物病害的早期识别对保障粮食安全至关重要。由乌干达马凯雷雷大学人工智能实验室于2020年创建的Beans数据集,聚焦于豆类叶片病害的自动化诊断。该数据集收录了健康与患病豆叶的高清图像,旨在通过图像分类技术辅助农业专家快速识别病害类型,从而推动精准农业在资源有限地区的应用。其构建不仅体现了人工智能在解决实际农业问题中的潜力,也为后续研究提供了宝贵的基准数据。
当前挑战
该数据集致力于解决豆类叶片病害的图像分类挑战,其核心难点在于叶片病征在视觉上具有高度相似性,且受光照、拍摄角度及叶片生长阶段等因素干扰,模型需具备强大的特征区分能力。在构建过程中,数据采集面临田间环境复杂多变、病害样本分布不均等困难,同时专家标注成本高昂,确保标注一致性与准确性亦成为关键瓶颈。这些挑战共同制约着模型在实际农业场景中的泛化性能与可靠性。
常用场景
经典使用场景
在农业智能与植物病理学交叉领域,nateraw/beans数据集以其精心标注的豆类叶片图像,为图像分类任务提供了经典范例。该数据集收录了健康叶片与患病叶片的视觉样本,常被用于训练深度学习模型,以自动化识别豆类作物中的常见病害,如锈病等。研究者通过构建卷积神经网络,能够高效区分不同健康状态的叶片,从而推动精准农业中的病害监测技术发展。
解决学术问题
该数据集有效应对了农业人工智能研究中数据稀缺与标注质量不一的挑战。通过提供专家生成的标准化图像标签,它助力解决了小样本学习、迁移学习在农业场景中的适用性问题,并为模型可解释性研究提供了真实世界的基础。其意义在于降低了农业病害智能诊断的门槛,促进了跨学科合作,对可持续农业发展具有深远影响。
衍生相关工作
围绕此数据集,已衍生出多项经典研究工作。例如,研究者利用其进行模型轻量化探索,以适应边缘计算设备;亦有工作专注于数据增强策略,以提升模型在复杂田间环境下的鲁棒性。此外,该数据集常作为基准,用于比较不同神经网络架构在细粒度农业图像分类任务上的性能,推动了领域内算法创新与评估标准化。
以上内容由遇见数据集搜集并总结生成



