IP102: A Large-Scale Benchmark Dataset for Insect Pest Recognition
收藏github2021-12-09 更新2024-05-31 收录
下载链接:
https://github.com/ZhiweiHuang5520/Crop-Pest-and-Disease-Dataset
下载链接
链接失效反馈资源简介:
这是一个大规模的昆虫害虫识别基准数据集,包含超过75,000张图片,共102类。数据集用于检测和分类任务,提供了详细的标注示例和分类类别。
This is a large-scale benchmark dataset for insect pest recognition, comprising over 75,000 images across 102 categories. The dataset is designed for detection and classification tasks, providing detailed annotation examples and classification categories.
创建时间:
2021-12-09
原始信息汇总
农业作物病虫害以及疾病数据集概述
1. IP102: A Large-Scale Benchmark Dataset for Insect Pest Recognition
- 下载地址: https://drive.google.com/drive/folders/1svFSy2Da3cVMvekBwe13mzyx38XZ9xWo?usp=sharing
- 数据集说明: 包含超过75,000张图片,共102类。
- 分类类别: 从1到102,详细列出了各类病虫害的名称。
2. PlantVillage
- 下载地址: https://data.mendeley.com/datasets/tywbtsjrjv/1
- 数据集说明: 包含54303张健康与不健康的叶子图片,按物种和疾病分为38类。
- 分类任务: 图片示例和标注示例提供了数据集的分类和标注方式。
3. Citrus Pest Benchmark
- 下载地址: https://github.com/edsonbollis/Citrus-Pest-Benchmark
- 数据集说明: 包含10,816张多类图像,分为七类,详细描述了各类螨虫的图像数量和分布。
- 分类任务: 提供了图像示例和分类示例。
4. SAUTAG
- 下载地址: https://github.com/SAUTEG/version_1.0
- 数据集说明: 详细描述了数据集的目录结构,包括作物种类、虫害名、病害名的拉丁学名使用,以及样本的存储方式。
- 分类任务: 描述了如何快速使用预先设计的数据集进行模型训练。
5. PestDataset
- 下载地址: https://github.com/FelipeVein/PestDataset
- 数据集说明: 包含1036张多类图像,分为九类。
- 分类任务: 提供了图像示例和标注示例。
6. pest-dataset(10 classes)
- 下载地址: https://sejonguniversity-my.sharepoint.com/:f:/g/personal/hanxiang_sju_ac_kr/EvrsNaKE_DZBgcHNG7fbQWgB0432dI0B7YfzzDUgEWEKCw
- 数据集说明: 包含5869张多类图像,分为10类。
- 分类任务: 提供了图像示例和分类类别。
7. AI CHANLLENGER--Plant Disease Recognition
- 下载地址: https://pan.baidu.com/s/1TH9qL7Wded2Qiz03wHTDLw
- 数据集说明: 训练集和验证集包含10种作物品种的健康样本和27种病害样本,测试集图片均属于这10种作物的健康或病害样本。
- 分类任务: 提供了图像示例和分类示例。
8. Rice Leaf Diseases Data Set
- 下载地址: https://archive.ics.uci.edu/ml/machine-learning-databases/00486/
- 数据集说明: 包含120张图片,分为三类/疾病:细菌性叶枯病,褐斑病和叶黑穗病,每个都有40张图像。
- 分类任务: 提供了图像示例。
9. Plant Leaves
- 下载地址: https://data.mendeley.com/datasets/hb74ynkjcn/1
- 数据集说明: 包含 4502 张健康和不健康植物叶子的图像,按物种和健康状况分为 22 个类别。
- 分类任务: 提供了图像示例和分类类别。
10. Plantae_k
- 下载地址: https://data.mendeley.com/datasets/hb74ynkjcn/1
- 数据集说明: 包含 2153 张健康和不健康植物叶子的图像,按物种和健康状况分为 16 个类别。
- 分类任务: 提供了图像示例和分类类别。
11. A database of eight common tomato pest images
- 下载地址: https://data.mendeley.com/datasets/s62zm6djd2/1
- 数据集说明: 该数据库基于八种常见番茄害虫,包括 (1) Tetranychus urticae、(2) Bemisia argentifolii、(3) Zeugodacus cucurbitae、(4) Thrips palmi、(5) Myzus persicae、(6) Spodoptera litura、(7) Spodoptera exigua 和 (8) Helicoverpa armigera。
- 分类任务: 提供了图像示例和分类类别。
12. 林业有害生物分类数据集
- 下载地址: https://aistudio.baidu.com/aistudio/datasetdetail/105865
- 数据集说明: 包括有:黑蚱蝉,蟪蛄,蒙古寒蝉等99种生物,共近2000张图片,各生物种类数据数量基本平衡。
- 分类任务: 提供了图像示例。
13. 华农bug和fruit bug数据集
- 下载地址: https://bj.bcebos.com/v1/ai-studio-online/df0ba590801145d59b8eccf67ba4a8d0ae817b734a524bbe93f0b0660345976c?responseContentDisposition=attachment%3B%20filename%3Dbug.zip&authorization=bce-auth-v1%2F0ef6765c1e494918bc0d4c3ca3e5c6d1%2F2021-07-17T13%3A17%3A05Z%2F-1%2F%2F209af583f99889481166a34da9f36969200220b58335fadcbffb3f84b82d768b
- 数据集说明: 包括有bug和fruit bug, 共8333张图片,各生物种类数据数量基本平衡。
- 分类与检测任务: 提供了图像示例和标注示例。
14. 中科院农作物病虫害样本数据集
- 下载地址: https://aistudio.baidu.com/aistudio/datasetdetail/57324
- 数据集说明: 包括127张图片,样本较少。
- 分类任务: 提供了图像示例和目录结构。
15. Dataset for pest classification in Mango farms from Indonesia
- 下载地址: https://md-datasets-cache-zipfiles-prod.s3.eu-west-1.amazonaws.com/94jf97jzc8-1.zip
- 数据集说明: 数据集集合包含 510 张图像,其中包括影响芒果叶的 15 类害虫以及在 6 个月内收集的芒果叶的原始外观(产生 16 类)。数据增强过程的结果产生总共 62,047 个图像样本。
- 分类任务: 提供了图像示例和目录结构。
16. ZIZANIA AND APPLE IMAGE DATASET
- 下载地址: https://ieee-dataport.org/documents/zizania-and-apple-image-dataset#files
- 数据集说明: zizania 图像数据集由总共 4900 个 zizanias 组成。 优质样本数量为2648个,缺陷质量样本数量为2252个。苹果图像数据集中有四类,分别是直径大于90mm、80-90mm之间、小于80mm、病虫害的苹果。
- 分类任务: 提供了图像示例。
17. Flavia
- 下载地址: https://sourceforge.net/projects/flavia/files/Standard%20Leaf%20Images/0.1/standardleaves.tar.bz2/download
- 数据集说明: 约600张,33类。
- 分类任务: 提供了图像示例和目录结构。
AI搜集汇总
数据集介绍

构建方式
IP102数据集的构建基于大规模的图像采集和精细的分类标注。该数据集收集了超过75,000张图片,涵盖102种不同的昆虫害虫类别。每张图片均经过详细的标注,包括昆虫的种类、位置信息等,确保数据的准确性和可用性。通过这种方式,数据集不仅提供了丰富的视觉信息,还为昆虫识别任务提供了高质量的训练数据。
特点
IP102数据集的主要特点在于其大规模和多样性。该数据集包含了超过75,000张图片,覆盖102种昆虫害虫,为昆虫识别提供了广泛的样本基础。此外,数据集的标注精细,每张图片都包含了详细的分类和位置信息,这使得该数据集在昆虫识别和检测任务中具有极高的实用价值。
使用方法
使用IP102数据集进行昆虫害虫识别任务时,用户可以首先下载数据集并解压缩。数据集提供了详细的分类和位置标注,用户可以根据需要选择合适的模型进行训练。建议使用深度学习框架如TensorFlow或PyTorch进行模型训练,利用数据集中的标注信息进行监督学习。训练完成后,模型可以用于实际的昆虫害虫识别应用中,提高农业生产的效率和质量。
背景与挑战
背景概述
IP102数据集是一个大规模的昆虫害虫识别基准数据集,由主要研究人员或机构于近年创建。该数据集包含了超过75,000张图片,涵盖102种不同的昆虫害虫类别。其核心研究问题在于通过图像识别技术,提高农业作物病虫害的检测与分类效率,从而为农业生产提供科学依据和技术支持。IP102数据集的推出,极大地推动了昆虫害虫识别领域的发展,为相关研究提供了丰富的数据资源和基准测试平台。
当前挑战
IP102数据集在构建过程中面临多项挑战。首先,昆虫害虫的多样性和复杂性使得图像采集和标注工作异常繁琐,需要高度的专业知识和细致的工作。其次,不同昆虫在不同环境下的外观变化较大,增加了分类模型的训练难度。此外,数据集的规模庞大,如何在保证数据质量的同时高效处理和存储这些数据,也是一个重要的技术挑战。这些挑战不仅影响了数据集的构建效率,也对后续的模型训练和应用提出了更高的要求。
常用场景
经典使用场景
IP102数据集在农业领域中被广泛用于昆虫害虫的识别与分类任务。其丰富的图像样本和详细的标注信息,使得该数据集成为研究者们开发和验证昆虫识别算法的首选资源。通过利用IP102数据集,研究者可以训练出高精度的昆虫分类模型,从而为农业生产中的害虫监测和防治提供技术支持。
衍生相关工作
基于IP102数据集,研究者们开展了多项相关工作,包括但不限于改进的卷积神经网络架构、迁移学习方法的应用以及多模态数据融合技术。这些研究不仅提升了昆虫识别的准确性,还推动了农业智能化的发展。例如,有研究利用IP102数据集开发了基于无人机的害虫监测系统,实现了大范围、高效率的农田害虫监测。
数据集最近研究
最新研究方向
在农业科技的快速发展背景下,IP102数据集作为大规模昆虫害虫识别的基准数据集,其最新研究方向主要集中在利用深度学习技术提升害虫识别的准确性和效率。研究者们通过引入先进的卷积神经网络(CNN)架构,如ResNet和EfficientNet,结合数据增强和迁移学习策略,以应对数据集中的类内变异和类间相似性问题。此外,跨域害虫识别和多模态数据融合也成为研究热点,旨在提高模型在不同环境条件下的泛化能力。这些研究不仅有助于精准农业的发展,也为全球粮食安全和农业可持续发展提供了技术支持。
以上内容由AI搜集并总结生成



