GE9X/FishDet-M

Name: GE9X/FishDet-M
Creator: GE9X
Published: 2025-12-15 08:37:37
License: 暂无描述

Hugging Face2025-12-15 更新2025-12-20 收录

下载链接：

https://hf-mirror.com/datasets/GE9X/FishDet-M

下载链接

链接失效反馈

官方服务：

资源简介：

FishDet-M是一个用于多样化水下环境中鱼类检测的最大统一基准数据集，旨在推动生态监测、水产养殖自动化和海洋机器人技术的发展。数据集包含105,556张图像和296,885个标注的鱼类实例，涵盖了海洋、半咸水、水族馆和遮挡场景等多种环境。数据集采用COCO风格的标注格式，并评估了28种模型，包括YOLOv8-v12、DETR、R-CNN变体等。此外，数据集还利用CLIP-Based Selection技术进行自动模型选择。数据集整合了13个公共数据集，涵盖了珊瑚礁、开放水域、养殖池和池塘等多种场景，图像分辨率从78×53到4608×3456像素不等。

FishDet-M is the largest unified benchmark dataset for fish detection in diverse underwater environments, designed to advance ecological monitoring, aquaculture automation, and marine robotics. The dataset contains 105,556 images with 296,885 annotated fish instances, covering marine, brackish, aquarium, and occluded scenes. It features COCO-style annotations with bounding boxes and evaluates 28 models including YOLOv8-v12, DETR, R-CNN variants, and more. Additionally, the dataset employs CLIP-Based Selection for automatic model selection. FishDet-M integrates 13 public datasets spanning coral reefs, open water, aquaculture tanks, and ponds, with image resolutions ranging from 78×53 to 4608×3456 pixels.

提供机构：

GE9X

搜集汇总

数据集介绍

构建方式

在海洋生态监测与水产养殖自动化的研究背景下，FishDet-M数据集应运而生，旨在解决水下目标检测中多源数据不统一的关键瓶颈。该数据集通过系统整合13个公开的鱼类检测子集，涵盖珊瑚礁、开放水域、养殖池塘及水族馆等多元场景，构建了迄今规模最大的统一基准。所有图像均经过标准化处理，采用COCO格式的边界框标注，确保数据的一致性与可复用性。最终形成了包含105,556张图像与296,885个标注实例的高质量数据集，图像分辨率跨度从78×53至4608×3456像素，单张图像中鱼类实例数量介于1至256之间，充分覆盖了从清澈到高度浑浊的水体条件。

使用方法

使用FishDet-M数据集时，研究者可直接从项目网站获取图像与COCO格式的标注文件，适用于目标检测模型的训练与评估。数据集支持标准深度学习框架（如PyTorch）的加载流程，用户可通过配置文件定义训练参数，并利用28个预训练模型检查点进行迁移学习或性能对比。特别地，数据集配套的CLIP引导选择器可基于视觉-语言对齐自动推荐最优模型，实现场景感知的动态部署。此外，交互式图形界面工具提供了模型比较的可视化环境，便于在生态监测、水产养殖计数及水下机器人等应用中快速验证算法效果。

背景与挑战

背景概述

鱼类检测在生态监测、水产养殖自动化和海洋机器人等领域具有重要应用价值，然而水下环境的复杂性——包括光照变化、水体浑浊度差异、目标尺度多样及遮挡频繁——使得传统检测方法难以泛化。为此，Khalifa大学自主机器人系统中心（KUCARS）的Muayad Abujabal、Lyes Saad Saoud与Irfan Hussain于2025年联合发布了FishDet-M数据集。该数据集整合了13个公开子集，涵盖珊瑚礁、开阔水域、养殖池塘等多种场景，包含105,556张图像与296,885个标注实例，是当前规模最大、场景最统一的鱼类检测基准。其核心研究问题在于构建一个能够适应不同水下视觉域的高鲁棒性检测框架，并首次引入基于CLIP的视觉-语言对齐机制实现自适应模型选择。FishDet-M不仅推动了水下目标检测领域的标准化评估，也为后续研究提供了28种先进模型的系统性能对比与部署指南。

当前挑战

FishDet-M所面对的挑战首先体现在领域问题的复杂性上：水下环境中的鱼类检测需同时应对极端尺度变化（图像分辨率从78×53到4608×3456像素）、密集鱼群场景（单张图像最多包含256个实例）以及严重遮挡与水体浑浊带来的视觉退化，这对模型的特征提取与泛化能力提出了严苛要求。其次，数据集构建过程本身也面临多重困难：来自13个不同来源的标注格式与语义标准不统一，需要耗费大量精力进行COCO格式的归一化与人工校验；同时，不同子集间的图像质量、目标密度与背景分布差异巨大，如何确保合并后的基准在保持多样性的同时具备公平可比性，成为设计中的关键瓶颈。此外，CLIP引导的选择器在零样本场景下仍需克服跨域分布偏移带来的性能波动，进一步增加了模型部署的不确定性。

常用场景

经典使用场景

在计算机视觉与海洋生态交叉领域，FishDet-M作为迄今规模最大的统一化鱼类检测基准数据集，其经典使用场景聚焦于复杂水下环境中目标检测模型的训练与评估。该数据集整合了13个公开子集，涵盖珊瑚礁、开阔水域、养殖池塘及浑浊条件等多模态场景，包含105,556张图像与近30万标注实例，支持从单鱼到密集鱼群（每图1-256实例）的鲁棒检测。研究者常利用其COCO格式标注对YOLOv8-v12、DETR、R-CNN等28种前沿检测器进行系统性横向对比，并借助CLIP视觉-语言对齐机制实现零样本场景自适应模型选择，为水下视觉感知奠定标准化评测基石。

解决学术问题

该数据集核心解决了水下鱼类检测长期面临的三大学术困境：数据碎片化、环境泛化性不足与模型选择主观化。通过统一13个异质数据集为单一基准，FishDet-M消除了因标注格式、分辨率（78×53至4608×3456像素）及环境差异导致的评估偏差，首次为多模态水下目标检测提供了可重复性强的实验平台。其系统性对比28种模型在遮挡、尺度变化与能见度退化下的性能边界，揭示了YOLO12x（0.491 mAP）等架构的鲁棒性极限，而CLIP引导的模型选择策略则开创了上下文感知的零样本迁移范式，显著推动了海洋视觉领域从经验调参向数据驱动的自适应决策演进。

实际应用

在实际部署层面，FishDet-M衍生的技术方案已深入渗透至海洋生态与智能渔业的多个环节。生态监测方面，基于YOLOv8n（251 FPS）的实时检测模型被用于珊瑚礁生物多样性自动评估与鱼类种群动态追踪，替代传统人工目视调查。水产养殖场景中，高精度检测器（如YOLO11l，0.484 mAP）实现了养殖池内鱼类计数、行为异常监测与投喂量优化，提升管理效率。此外，该数据集支撑的水下机器人视觉系统能够自主识别目标鱼类，辅助海洋保护区巡逻与渔网清理任务，而交互式GUI工具则降低了非AI专家（如海洋生物学家）部署检测模型的工程门槛。

数据集最近研究