GPYOLO Fish Disease Dataset
收藏github2026-04-26 更新2026-05-02 收录
下载链接:
https://github.com/moonburntcat/GPYOLO
下载链接
链接失效反馈官方服务:
资源简介:
我们的数据集包含:2,055张标注图像,11种鱼类,22个细粒度类别。疾病表型包括EUS、细菌性、真菌性、寄生虫性和病毒性疾病。
Our dataset contains 2,055 annotated images covering 11 fish species and 22 fine-grained categories. The disease phenotypes include EUS, bacterial, fungal, parasitic and viral diseases.
创建时间:
2026-04-24
原始信息汇总
GPYOLO 数据集详情
基本信息
- 项目名称:GPYOLO(Real-Time Fish Disease Detection in Complex Aquaculture Scenes with Cloud and Edge Deployment)
- 研究目标:在复杂水产养殖场景下进行实时鱼类疾病检测,支持云和边缘部署
- 论文状态:正在《Computers and Electronics in Agriculture》期刊审稿中
数据集规模与构成
- 标注图像数量:2,055 张
- 鱼类物种数:11 种
- 细粒度类别数:22 个
- 疾病类型:包括溃疡性综合征(EUS)、细菌性疾病、真菌性疾病、寄生虫病和病毒性疾病
涵盖的鱼类物种
- 鲶鱼(Miichthys miiuy)
- 黄尾鱼(Yellowtail)
- 棕鱼(Brown croaker)
- 三文鱼(Salmon)
- 鲤鱼(Carp)
- 金鱼(Goldfish)
- 罗非鱼(Tilapia)
- 刺盖鱼(Colisa lalia)
- 鲷鱼(Snapper)
- 金钱鱼(Selenotoca multifasciata)
- 鲫鱼(Crucian carp)
数据来源
数据集由内部数据集和公开鱼类疾病图像资源共同组成
性能指标
| 指标 | GPYOLO | 相比 YOLOv11s 提升 |
|---|---|---|
| 精确率(Precision) | 97.36% | +4.86% |
| 召回率(Recall) | 91.65% | +7.09% |
| mAP50 | 96.34% | +5.04% |
| 边缘设备速度 | 64.3 FPS(Jetson Orin Nano Super) |
自适应阈值焦点损失(ATFL)性能
| 类别分组 | 基准(无 ATFL) | GPYOLO(含 ATFL) | 提升幅度 |
|---|---|---|---|
| 头部类别(>120 样本) | 95.79 | 95.67 | -0.12 |
| 中部类别(40-120 样本) | 94.54 | 95.04 | +0.50 |
| 尾部类别(<40 样本) | 91.87 | 93.40 | +1.53 |
| 总体 | 94.45 | 95.58 | +1.13 |
核心技术改进
- C3k2-LSKA:扩大有效感受野,增强对细微病变纹理的建模
- DSConv:减少颈部网络的计算量和内存开销,保持精度
- ATFL(自适应阈值焦点损失):重新加权困难病变样本,抑制易分类健康样本,应对长尾不平衡
- MGD(掩码生成蒸馏):从大模型向轻量级学生模型蒸馏知识
部署方案
- 支持集中式云端分析
- 支持低延迟边缘端检测
数据集文件说明
- 数据集配置文件位置:
data/NEU-DET.yaml - 原始训练图像不包含在仓库中
- 原始数据集文件和训练好的 GPYOLO 检查点均未包含在仓库中
搜集汇总
数据集介绍

构建方式
该数据集专为复杂水产养殖场景下的鱼类疾病实时检测而构建,整合了机构内部积累的数据与公开的鱼类病害图像资源。最终收录2,055张经过精细标注的图像,涵盖11个鱼种及22个细粒度疾病类别,包含EUS、细菌性、真菌性、寄生虫及病毒性等多种疾病表型,为多鱼种、多疾病的综合健康监测提供了坚实基础。
使用方法
使用者可通过GitHub仓库获取完整代码及配置。需先依据安装指南配置Ultralytics YOLO11环境,随后修改data/NEU-DET.yaml文件中的数据集路径以指向本地图像根目录。训练可直接运行train.py脚本或使用yolo CLI命令,支持自定义epoch、批大小等超参数。验证与预测分别通过val和predict命令执行,并提供了FPS基准测试、Grad-CAM热力图及模拟浊度鲁棒性评估等辅助分析工具。
背景与挑战
背景概述
在智慧水产养殖领域,鱼类疾病的实时检测是保障水产经济可持续发展的关键技术瓶颈。传统的人工巡检方式效率低下,且受限于水体浑浊、光照不均、病灶边界模糊等复杂养殖环境的干扰,难以实现精准的早期预警。GPYOLO Fish Disease Dataset由Wang Duanrui、Ge Fan等研究人员于2026年构建,发表于《Computers and Electronics in Agriculture》,旨在解决多鱼种、多病种在边缘端与云端协同部署下的实时检测问题。该数据集包含2,055张标注图像,涵盖11个鱼类物种和22种细粒度疾病类别,包括细菌、真菌、寄生虫及病毒性疾病,为开发高精度轻量化检测模型提供了基准,有力推动了水产养殖自动化和智能化进程。
当前挑战
该数据集所应对的领域挑战主要源于复杂水产环境中的多源干扰:水体浑浊导致病灶纹理模糊、光照变化引发的图像对比度不均,以及鱼体遮挡与背景杂乱,使得模型难以准确区分微小病变。此外,疾病类别呈现长尾分布,少数罕见病种样本严重不足,加剧了模型对尾类疾病的识别困难。在构建过程中,挑战包括多源数据的整合与一致性标注,需从既有内部数据集和公开资源中筛选并统一疾病表型标准,同时应对病灶边界模糊带来的标注主观性。模型还需兼顾边缘端低延迟(如Jetson Orin Nano Super上达64.3 FPS)与高精度(mAP50达96.34%),在资源受限硬件上实现可靠部署。
常用场景
经典使用场景
在复杂水产养殖场景中,GPYOLO Fish Disease Dataset被广泛用作鱼类疾病实时检测的标准基准。该数据集包含2055张精细标注图像,覆盖11个鱼种和22种细粒度疾病类别,尤其适用于浑浊水体、光照不均、遮挡背景杂乱以及病灶边缘模糊等极具挑战性的水下环境。研究者常利用该数据集评估目标检测算法在长尾分布下的鲁棒性,并结合C3k2-LSKA模块增强对微小病灶的纹理感知,从而验证模型在边缘设备上的实时推理能力。
解决学术问题
该数据集精准回应了水产养殖视觉检测领域中长期存在的两大核心学术困境:病灶特征微弱且易与水下噪声混淆,以及疾病样本天然呈现长尾分布导致少数类别难以被模型有效学习。GPYOLO通过引入自适应阈值焦点损失(ATFL)显著提升尾部稀有疾病类的召回率,较基线提高1.53个百分点,同时利用掩膜生成蒸馏(MGD)实现大型模型向轻量级学生模型的知识迁移。这些创新为水下医学视觉中的小目标检测和类别不平衡问题提供了系统性的解题范式,推动了精准水产养殖与智能病害防控的理论发展。
实际应用
在实际水产养殖场景中,该数据集驱动的GPYOLO模型可同时部署于云端集中分析平台与边缘计算节点,实现64.3 FPS的Jetson Orin Nano Super端侧实时检测速度。养殖户可直接利用搭载该模型的低功耗摄像头,对大黄鱼、罗非鱼、鲤鱼等经济鱼类的细菌性溃疡、真菌感染、寄生虫侵袭等多类疾病进行全天候自动巡检。如此不仅大幅降低人工巡检成本,更能在疾病暴发早期提供精准预警,从而有效减少抗生素滥用并提升养殖存活率,助力现代渔业向智能化、精细化转型。
数据集最近研究
最新研究方向
面向复杂养殖场景的实时鱼类病害检测是当前智慧水产领域的前沿方向,GPYOLO Fish Disease Dataset的发布为这一课题提供了关键数据支撑。该数据集涵盖11个鱼类物种、22种细粒度病害类别,包含溃疡综合征、细菌、真菌、寄生虫及病毒性病变,突破了传统数据集在浑浊水体、光照不稳、遮挡及模糊病灶等复杂条件下的局限性。依托YOLOv11架构,研究者引入C3k2-LSKA模块增强病灶特征提取、DSConv实现轻量化部署、自适应阈值焦点损失ATFL改善长尾分布下的少样本分类性能,并采用掩码生成蒸馏MGD实现云边协同实时推理,在边缘设备上达到64.3 FPS的检测速度,mAP50提升至96.34%。该工作为水产养殖智能化监测树立了新基准,推动了病害早期预警与精准防控技术的落地应用。
以上内容由遇见数据集搜集并总结生成



