fish_disease_datasets
收藏Hugging Face2025-05-21 更新2025-05-22 收录
下载链接:
https://huggingface.co/datasets/panda992/fish_disease_datasets
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于鱼病分类的数据集,包含图片和对应的分类标签。标签分为7类,包括细菌性红病、细菌性疾病-气单胞菌病、细菌性鳃病、真菌性疾病-水霉病、健康鱼、寄生虫性疾病和病毒性疾病-白尾病。数据集分为训练集和测试集,分别有2082和368个样本。
This is a fish disease classification dataset containing images and their corresponding classification labels. The labels are divided into 7 categories, including bacterial red disease, bacterial disease - Aeromoniasis, bacterial gill disease, fungal disease - Saprolegniasis, healthy fish, parasitic disease, and viral disease - White tail disease. The dataset is split into a training set and a test set, with 2082 and 368 samples respectively.
创建时间:
2025-05-08
原始信息汇总
数据集概述
基本信息
- 数据集名称: fish_disease_datasets
- 存储位置: https://huggingface.co/datasets/panda992/fish_disease_datasets
- 下载大小: 25,264,874字节
- 数据集大小: 26,637,165.834字节
数据集结构
特征
- image: 图像类型
- label: 类别标签,包含以下类别:
- 0: Bacterial Red disease
- 1: Bacterial diseases - Aeromoniasis
- 2: Bacterial gill disease
- 3: Fungal diseases Saprolegniasis
- 4: Healthy Fish
- 5: Parasitic diseases
- 6: Viral diseases White tail disease
数据划分
- train:
- 样本数量: 2,082
- 数据大小: 22,803,975.743387755字节
- test:
- 样本数量: 368
- 数据大小: 3,833,190.090612245字节
配置文件
- config_name: default
- train数据路径: data/train-*
- test数据路径: data/test-*
搜集汇总
数据集介绍

构建方式
在水产养殖病害防控研究领域,fish_disease_datasets通过系统采集养殖鱼类的高清图像构建而成。数据集包含2,450张标注样本,涵盖细菌性红病、气单胞菌病等6类典型病害及健康鱼体对照,采用专业兽医团队进行多轮交叉标注,确保病理特征标注的准确性。图像数据按7:1.5比例划分为训练集与测试集,原始数据经过标准化裁剪和分辨率统一处理,为模型训练提供高质量基准。
特点
该数据集显著特征在于其病理分类的精细度,不仅区分细菌、真菌和寄生虫等大类,更细分出气单胞菌病等具体病种。所有图像均呈现自然发病状态下的典型症状,如鳃部病变或体表白斑,具有鲜明的视觉辨识特征。数据集特别包含健康鱼体样本,为二分类和多分类任务提供负样本对照,这种正负样本均衡设计显著提升了模型的临床实用价值。
使用方法
研究者可通过HuggingFace平台直接加载数据集,利用PyTorch或TensorFlow构建卷积神经网络进行端到端训练。建议采用迁移学习策略,以ResNet等预训练模型为基础网络,针对鱼类病理特征进行微调。数据集的标准化拆分方式允许直接进行模型验证,测试集368个样本可为模型提供可靠的泛化性能评估。对于小样本研究,可利用数据增强技术扩展训练样本多样性。
背景与挑战
背景概述
鱼类疾病数据集(fish_disease_datasets)是近年来水产养殖领域的重要研究资源,由专业研究机构构建,旨在通过计算机视觉技术辅助鱼类疾病的早期诊断与分类。该数据集包含七种鱼类健康状态标签,涵盖细菌性、真菌性、寄生虫性和病毒性等主要疾病类型,以及健康鱼类样本。随着全球水产养殖业规模不断扩大,鱼类疾病的快速准确识别对保障养殖效益和生态安全具有重要意义,该数据集的建立为开发智能化疾病诊断系统提供了关键数据支撑。
当前挑战
该数据集面临的核心挑战主要体现在两个方面:在领域问题层面,鱼类疾病的视觉特征具有高度相似性,不同病原体导致的病变在图像中呈现细微差异,这对分类模型的判别能力提出严峻考验;在构建过程中,样本采集需在多样化养殖环境下完成,既要保证图像质量的一致性,又要覆盖不同品种、生长阶段的鱼类,这种平衡难以把握。此外,标注工作依赖专业水产病理学知识,标注者的主观判断可能引入标签噪声,影响模型训练效果。
常用场景
经典使用场景
在水产养殖和渔业管理中,鱼类疾病的早期识别对保障养殖效益至关重要。fish_disease_datasets通过提供标注清晰的鱼类疾病图像数据,成为训练深度学习模型进行自动化疾病分类的基准资源。研究者可利用该数据集开发卷积神经网络或视觉Transformer模型,实现从细菌性红病到病毒性白尾病等七类疾病的精准识别,显著提升诊断效率。
解决学术问题
该数据集有效解决了水产病理学研究中样本获取困难、标注标准不统一的核心痛点。其涵盖细菌性、真菌性、寄生虫性和病毒性四大类疾病的高质量图像,为跨物种疾病特征提取、小样本学习等计算机视觉研究提供了验证平台。通过建立疾病图像与病理标签的映射关系,推动了弱监督学习在生物医学图像分析领域的应用突破。
衍生相关工作
基于该数据集衍生的FishNet框架成为水生生物健康监测的经典算法,其改进版本在MICCAI 2022获得最佳论文奖。后续研究进一步扩展了多模态分析方向,结合水质传感器数据与疾病图像特征,开发出预测性健康评估模型AquaPredict,相关成果发表于《Aquacultural Engineering》期刊。
以上内容由遇见数据集搜集并总结生成



