EO19: Family-Level, Life-Stage-Aware Insect Detection Dataset for Agricultural Pest Monitoring
收藏github2026-01-03 更新2026-01-05 收录
下载链接:
https://github.com/chfff123/EO19-detector
下载链接
链接失效反馈官方服务:
资源简介:
EO19是一个专为农业害虫监测设计的昆虫检测数据集。它以家族级别(拉丁名称)组织类别,并引入了生命阶段感知标注规则:对于全变态家族,成虫和幼虫被标注为两个独立的类别,以减少训练中的类内外观冲突。数据集范围包括8目、19科、30个类别,共24,626张图像。图像来源包括现有数据集的筛选和清理图像以及通过拉丁/英文/中文/通用名和物种名收集的公共网络图像。
EO19 is an insect detection dataset specifically designed for agricultural pest monitoring. It organizes categories at the family level using Latin names, and introduces a life-stage-aware annotation rule: for holometabolous families, adults and larvae are annotated as two distinct categories to mitigate intra-class appearance conflicts during training. The dataset encompasses 8 orders, 19 families, 30 categories, with a total of 24,626 images. The image sources consist of filtered and cleaned images from existing datasets, as well as publicly available web images collected using their Latin, English, Chinese, common names and species names.
创建时间:
2026-01-02
原始信息汇总
EO19 数据集概述
数据集基本信息
- 数据集名称:EO19: Family-Level, Life-Stage-Aware Insect Detection Dataset for Agricultural Pest Monitoring
- 核心用途:农业害虫监测
- 当前状态:公开预览版(论文/数据集尚未正式发布)
- 数据集地址:https://github.com/chfff123/EO19-detector
数据集构成
- 类别组织:在科级别(拉丁名)进行组织。
- 生命周期感知标注规则:对于全变态昆虫科,将成虫和幼虫标注为两个独立的类别,以减少训练中的类内外观冲突。
- 分类学范围:昆虫纲 → 8个目,19个科,30个类别。
- 图像数量:总计 24,626 张图像。
- 生命周期划分:11个全变态昆虫科被划分为成虫/幼虫(共22个类别);其余科各保留一个类别。
- 数据来源:来自现有数据集的精选图像 + 公共网络图像(具体细节和发布政策待定)。
数据文件与标注
-
图像命名规则:
- 全变态昆虫科:
- 成虫:
A_<FamilyLatin>_<Index>.jpg - 幼虫:
L_<FamilyLatin>_<Index>.jpg
- 成虫:
- 半变态昆虫科:
<FamilyLatin>_<Index>.jpg
- 全变态昆虫科:
-
标注工具:LabelImg
-
标注格式:边界框紧密覆盖整个昆虫身体。
-
主要格式:Pascal VOC XML。
-
导出格式:YOLO (
.txt), COCO (.json)。 -
推荐数据集结构(COCO格式):
EO19/ images/ train/ val/ test/ annotations/ eo19_train.json eo19_val.json eo19_test.json
模型基准测试结果
所有结果均为在EO19验证集上的COCO风格指标(AP, AP50, AP75, AP_S/M/L)的三次运行平均值,数值范围为 [0, 1]。
基准模型性能排行榜
| 模型 | 骨干网络 | AP | AP50 | AP75 | AP_S | AP_M | AP_L |
|---|---|---|---|---|---|---|---|
| D-FINE Large | HGNetv2 | 0.701 | 0.900 | 0.762 | 0.321 | 0.534 | 0.799 |
| D-FINE Medium | HGNetv2 | 0.693 | 0.885 | 0.756 | 0.282 | 0.524 | 0.792 |
| DEIM v1 | HGNetv2 | 0.692 | 0.887 | 0.754 | 0.309 | 0.545 | 0.794 |
| RT-DETR | PResNet-18 | 0.666 | 0.866 | 0.729 | 0.277 | 0.492 | 0.770 |
| Co-DETR | ResNet-50 | 0.611 | 0.814 | 0.668 | 0.218 | 0.408 | 0.720 |
| Co-DINO | ViT-L (5-scale) | 待定 | 待定 | 待定 | 待定 | 待定 | 待定 |
YOLOv12(实验性)结果
| 运行组 | 图像数 | 实例数 | 精确率(P) | 召回率(R) | mAP@0.50 | mAP@0.50:0.95 |
|---|---|---|---|---|---|---|
| 1 | 2462 | 5394 | 0.883 | 0.809 | 0.872 | 0.677 |
| 2 | 2462 | 5394 | 0.880 | 0.817 | 0.870 | 0.675 |
| 3 | 2462 | 5394 | 0.880 | 0.809 | 0.866 | 0.674 |
| 平均 | 2462 | 5394 | 0.881 | 0.812 | 0.869 | 0.675 |
使用要求与准备
- 类别数量:确保模型配置中
num_classes = 30。 - 环境依赖:不同基准模型依赖不同的软件框架和版本,具体版本要求见README中的“Requirements (Software)”部分。
- 预训练模型:当前公开预览版不包含训练好的检查点文件(
.pth),下载链接和SHA256将在发布后提供。
引用与许可
- 引用格式:提供了BibTeX格式的引用占位符,具体信息待论文发布后更新。
- 许可信息:论文、数据集和代码的许可信息均为待定状态。
待定信息
- 论文PDF/arXiv/项目页面链接。
- 数据集下载链接、发布形式及校验和。
- 完整的作者列表及所属机构。
- 训练好的检查点文件(
.pth)下载链接。 - Co-DINO模型的完整基准测试结果。
- YOLOv12模型的AP75、AP_S、AP_M、AP_L指标。
- 具体的许可协议(如CC BY-NC 4.0等)。
- 联系人邮箱。
搜集汇总
数据集介绍

构建方式
在农业害虫监测领域,精准识别昆虫类别及其发育阶段对有效防控至关重要。EO19数据集的构建采用了系统化的图像采集与标注策略,其图像来源包括现有数据集的筛选清洗以及基于拉丁名、英文名、中文名和物种名的公开网络图像收集。所有图像均经过统一的质量控制,确保标注的准确性与一致性。标注过程中,采用LabelImg工具进行边界框标注,紧密覆盖昆虫整体,并依据昆虫的完全变态发育特性,将11个完全变态昆虫科的成虫与幼虫划分为独立类别,以减少类内外观冲突。最终形成了涵盖8目、19科、30个类别的结构化数据集。
使用方法
为便于研究者使用,EO19数据集已预先划分为训练集、验证集和测试集,并以COCO格式组织。使用者需首先设置环境变量指向数据集根目录,并确保模型配置中的类别数量设置为30。数据集支持多种主流目标检测框架,包括MMDetection、RT-DETR、DEIM和D-FINE等。评估时,建议使用各基线模型原生的评估脚本,仅需修改数据集路径、标注文件路径及图像前缀等配置项即可。数据集的标准化格式与清晰的目录结构,为快速开展模型训练、性能比较以及在农业害虫智能监测领域的算法创新提供了坚实基础。
背景与挑战
背景概述
在农业害虫监测领域,精准识别昆虫类别及其生长阶段对于实施有效防治策略至关重要。EO19数据集应运而生,旨在为这一领域提供高质量、细粒度的视觉数据支持。该数据集由研究团队于2026年前后构建,专注于解决农业场景下昆虫检测的核心问题,即如何在复杂自然环境中准确区分不同科属的害虫及其幼虫与成虫形态。通过整合来自现有数据集和公共网络的图像资源,并采用拉丁学名进行科级分类,同时引入生命周期感知标注规则,EO19显著提升了模型对全变态昆虫类群内部表观差异的区分能力,为智能农业中的害虫自动监测系统奠定了坚实的数据基础。
当前挑战
EO19数据集致力于应对农业害虫检测中的关键挑战,其核心在于解决细粒度昆虫识别难题。由于同类昆虫在不同生命周期阶段形态差异显著,传统检测方法常因类内表观冲突而导致误判。该数据集通过将全变态昆虫的成虫与幼虫标注为独立类别,直接针对这一领域挑战,旨在降低模型的学习难度并提升识别精度。在构建过程中,研究团队面临多重困难,包括从多样化的公开来源中筛选和清理高质量图像,确保标注的准确性与一致性,以及处理不同数据源的许可协议以合规发布数据集。这些挑战共同塑造了数据集的最终形态与发布策略。
常用场景
经典使用场景
在农业害虫监测领域,精准识别昆虫类别及其生长阶段对于实施有效防治策略至关重要。EO19数据集以其家族级分类和生命阶段感知标注的独特设计,为计算机视觉模型提供了经典的应用场景。该数据集通过将全变态昆虫的成虫与幼虫划分为独立类别,显著降低了类内外观冲突,使得模型能够更准确地学习不同生命阶段的形态特征。这一特性使得EO19成为评估和优化目标检测算法在复杂农业环境下性能的理想基准,尤其适用于研究模型对昆虫细微形态变化的识别能力。
解决学术问题
EO19数据集针对农业昆虫识别中的关键学术挑战提供了系统化解决方案。传统昆虫数据集往往忽略生命阶段差异,导致模型在识别同一物种不同形态时性能下降。该数据集通过引入生命阶段感知标注规则,有效解决了类内变异性问题,为研究细粒度视觉识别提供了高质量数据支撑。同时,其采用拉丁学名进行家族级分类,减少了常见名带来的歧义,促进了跨语言、跨区域研究的标准化。这些设计显著提升了模型在真实农业场景中的泛化能力和鲁棒性,推动了精准农业智能监测技术的发展。
实际应用
在实际农业生产中,EO19数据集为开发自动化害虫监测系统提供了坚实的数据基础。基于该数据集训练的模型可部署于田间智能传感设备,实现对特定害虫家族及其生命阶段的实时识别与计数。这种能力使得农民能够精确掌握害虫种群动态,及时采取针对性防治措施,减少农药滥用,促进生态友好型农业实践。此外,数据集支持的多尺度评估指标(如AP_S、AP_M、AP_L)确保了模型在不同大小昆虫检测上的可靠性,适用于从宏观田间普查到微观个体分析的多层次应用需求。
数据集最近研究
最新研究方向
在农业害虫监测领域,昆虫识别数据集正朝着精细化与生态感知方向发展。EO19数据集以科级拉丁名分类,并引入生命周期感知标注规则,将全变态昆虫的成虫与幼虫作为独立类别,有效缓解了类内外观冲突,提升了模型在真实农田环境中的泛化能力。当前研究聚焦于利用先进视觉Transformer与检测Transformer架构,如Co-DINO、RT-DETR和D-FINE等模型,在复杂背景下实现多尺度、小目标昆虫的精准检测。这些探索不仅推动了智能植保技术的进步,也为应对全球气候变化下的病虫害爆发提供了数据驱动的解决方案,具有重要的生态与经济意义。
以上内容由遇见数据集搜集并总结生成



