yusuf802/new-image-dataset|图像识别数据集|农作物病害识别数据集

hugging_face2023-10-14 更新2024-03-04 收录

图像识别

农作物病害识别

下载链接：

https://hf-mirror.com/datasets/yusuf802/new-image-dataset

下载链接

链接失效反馈

资源简介：

该数据集包含图像和标签两个特征，图像特征的类型是图像，标签特征的类型是分类标签，包含多个植物病害和健康状态的类别。数据集分为训练集和测试集，分别包含56842和10032个样本。数据集的大小和下载大小也被提供。

This dataset includes two features: image and label. The image feature is of image type, and the label feature is of class label type, including multiple plant diseases and healthy states. The dataset is divided into training and test sets, containing 56842 and 10032 samples respectively. The size and download size of the dataset are also provided.

提供机构：

yusuf802

原始信息汇总

数据集概述

数据集配置

默认配置 (default)
- 训练集 (train): 路径为 data/train-*
- 测试集 (test): 路径为 data/test-*

数据集信息

特征
- 图像 (image): 数据类型为图像
- 标签 (label): 数据类型为类别标签，包含以下类别名称：
  - 0: Apple_Black_rot
  - 1: Apple_Cedar_apple_rust
  - 2: Apple_Powdery_mildew
  - 3: Apple_healthy
  - 4: Apple_scab
  - 5: Cherry_(including_sour)_Powdery_mildew
  - 6: Cherry_(including_sour)_healthy
  - 7: Corn_(maize)_Cercospora_leaf_spot Gray_leaf_spot
  - 8: Corn_(maize)_Common_rust
  - 9: Corn_(maize)_Northern_Leaf_Blight
  - 10: Corn_(maize)_healthy
  - 11: Cotton_leaf_diseased
  - 12: Cotton_leaf_fresh
  - 13: Grape_Black_rot
  - 14: Grape___Esca_(Black_Measles)
  - 15: Grape___Leaf_blight_(Isariopsis_Leaf_Spot)
  - 16: Grape___healthy
  - 17: Orange_Haunglongbing_(Citrus_greening)
  - 18: Orange__Black_Rot
  - 19: Orange__Canker
  - 20: Orange__Healthy
  - 21: Peach_Bacterial_spot
  - 22: Peach_healthy
  - 23: Pepper,_bell_Bacterial_spot
  - 24: Pepper,_bell_healthy
  - 25: Potato_Early_blight
  - 26: Potato_Late_blight
  - 27: Potato_healthy
  - 28: Squash_Powdery_mildew
  - 29: Strawberry_Leaf_scorch
  - 30: Strawberry_healthy
  - 31: Tomato_Bacterial_spot
  - 32: Tomato_Early_blight
  - 33: Tomato_Late_blight
  - 34: Tomato_Leaf_Mold
  - 35: Tomato_Septoria_leaf_spot
  - 36: Tomato_Spider_mites_Two_spotted_spider_mite
  - 37: Tomato_Target_Spot
  - 38: Tomato_Tomato_Yellow_Leaf_Curl_Virus
  - 39: Tomato_Tomato_mosaic_virus
  - 40: Tomato_healthy
  - 41: Wheat_healthy
  - 42: Wheat_leaf_rust
  - 43: Wheat_nitrogen_deficiency

数据集分割

训练集 (train)
- 字节数: 5580252809.260068
- 样本数: 56842
测试集 (test)
- 字节数: 960697024.6779323
- 样本数: 10032

数据集大小

下载大小: 6476692260 字节
数据集大小: 6540949833.938 字节

AI搜集汇总

数据集介绍

构建方式

在农业病害识别领域，yusuf802/new-image-dataset数据集通过系统地收集和分类多种农作物的病害图像，构建了一个全面且多样化的图像库。该数据集的构建过程包括对不同农作物（如苹果、葡萄、番茄等）的病害图像进行采集，并根据病害类型进行细致的标签分类。具体而言，数据集分为训练集和测试集，分别包含56842和10032个样本，确保了模型训练和评估的独立性。

使用方法

使用yusuf802/new-image-dataset数据集进行研究时，首先需根据数据集提供的配置文件进行数据加载，确保训练集和测试集的正确分离。随后，可以利用图像处理技术对数据进行预处理，如图像增强、归一化等，以提高模型的识别精度。在模型训练阶段，建议采用深度学习框架，如TensorFlow或PyTorch，结合卷积神经网络（CNN）进行病害图像的分类训练。最后，通过测试集对模型进行评估，以验证其在实际应用中的性能。

背景与挑战

背景概述

在农业科技领域，植物病害的早期检测与分类对于提高作物产量和质量至关重要。yusuf802/new-image-dataset数据集由yusuf802创建，旨在为研究人员提供一个全面的图像数据集，用于训练和评估植物病害检测模型。该数据集包含了多种农作物的健康与病害图像，涵盖了苹果、樱桃、玉米、葡萄、橙子、桃子、辣椒、马铃薯、草莓、番茄、小麦等多种作物。数据集的创建时间为近期，主要研究人员或机构未明确提及，但其核心研究问题在于通过图像识别技术实现植物病害的自动化检测与分类，这对于农业领域的智能化发展具有重要推动作用。

当前挑战

该数据集在构建过程中面临的主要挑战包括：1) 图像数据的多样性和复杂性，不同作物和病害的图像特征差异较大，增加了模型训练的难度；2) 数据集的平衡性问题，某些病害类别的样本数量较少，可能导致模型在处理这些类别时表现不佳；3) 数据集的标注质量，高质量的标注是确保模型准确性的基础，但手动标注大量图像既耗时又容易出错。此外，数据集的规模和多样性虽然为研究提供了丰富的资源，但也对计算资源和模型性能提出了更高的要求。

常用场景

经典使用场景

在农业科技领域，yusuf802/new-image-dataset 数据集被广泛用于植物病害识别与分类任务。该数据集包含了多种农作物及其病害的图像，涵盖了苹果、葡萄、番茄等多种常见作物。通过深度学习模型，研究人员能够训练出高效的病害检测系统，从而实现对农作物健康状况的实时监控与预警。

解决学术问题

该数据集解决了农业领域中植物病害自动识别的学术难题。传统的病害识别依赖于专家经验和人工检测，效率低下且易受主观因素影响。通过引入深度学习技术，该数据集为研究人员提供了一个标准化的数据平台，推动了病害识别算法的创新与发展，显著提升了识别精度和效率。

实际应用

在实际应用中，yusuf802/new-image-dataset 数据集被用于开发智能农业系统，帮助农民及时发现并处理作物病害。例如，通过无人机或智能摄像头采集作物图像，系统能够自动识别病害类型并给出防治建议，从而减少农药使用，提高作物产量和质量，实现农业生产的智能化和可持续发展。

数据集最近研究

最新研究方向

在农业科技领域，yusuf802/new-image-dataset的最新研究方向主要集中在利用深度学习技术进行植物病害的自动检测与分类。该数据集包含了多种农作物及其病害的图像，为研究人员提供了丰富的数据资源，以开发和优化病害识别算法。当前的研究热点包括提高模型的准确性和鲁棒性，以及探索如何在资源受限的环境中实现高效的病害检测。这些研究不仅有助于提升农业生产的效率和质量，还对全球粮食安全具有重要意义。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源，是提供人类基本需求和基本社会保障的先决条件；也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础，兼具学术、经济、社会等多种价值。本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分（含胆固醇）数据，657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库，由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音，录音在安静的室内环境中使用高保真麦克风进行，并下采样至16kHz。通过专业的语音标注和严格的质量检查，手动转录的准确率超过95%。该数据集免费供学术使用，旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集，包含12,163个临床案例，涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程，强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”，经过专业医生验证和去识别化处理，确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力，解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录

开源PHM数据集

本文分享了一个全球各大学、研究机构和公司捐赠的PHM（Prognostics and Health Management）开源数据集，涵盖加工制造、轨道交通、能源电力和半导体等行业的多种场景，包含部件级、设备级和产线级数据。用户可以利用这些数据开发智能分析和建模算法，数据集分类包括故障诊断、健康评估和寿命预测。

github 收录

LibriSpeech

LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库，由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物，并经过仔细分割和对齐。

OpenDataLab 收录