DeepSalmon
收藏arXiv2025-03-20 更新2025-03-25 收录
下载链接:
http://arxiv.org/abs/2503.16051v1
下载链接
链接失效反馈官方服务:
资源简介:
DeepSalmon数据集是一个较大的鱼类数据集,由挪威科技大学等机构推出,包含12段难度较大的视频,视频中的鱼类为萨拉丁鱼种,分别在控制箱和臭氧箱中拍摄。该数据集因水下 visibility 差、环境欺骗性外观以及大量鱼类的出现和相互遮挡等特点,使得鱼类检测非常困难。数据集提供了200个视频帧的语义和实例级注释。
The DeepSalmon dataset is a large-scale fish dataset developed by institutions including the Norwegian University of Science and Technology. It includes 12 high-difficulty video clips featuring salmon species, filmed in both control tanks and ozone tanks. This dataset presents considerable challenges for fish detection due to poor underwater visibility, deceptive environmental appearances, the high abundance of fish, and frequent mutual occlusions among individuals. The dataset provides semantic and instance-level annotations for 200 video frames.
提供机构:
挪威科技大学、布加勒斯特理工大学、罗马尼亚科学院数学研究所
创建时间:
2025-03-20
搜集汇总
数据集介绍

构建方式
DeepSalmon数据集的构建采用了创新的两阶段无监督分割方法,通过将虚拟鱼类植入真实水下栖息地图像中生成合成训练数据。在第一阶段,研究人员对虚拟鱼类进行薄板样条形状变形和颜色直方图匹配等变换,使其与背景环境自然融合。第二阶段则利用第一阶段模型的软输出来匹配真实鱼类的颜色分布,进一步提升数据的真实性。整个流程完全无需人工标注,通过自动化方式生成了30GB的大规模水下鲑鱼分割数据集。
使用方法
该数据集适用于开发水下鱼类分割算法,特别是针对低能见度环境的鲁棒性研究。使用者可采用论文提出的两阶段训练策略:首先在合成数据上预训练模型,随后利用直方图匹配技术微调模型以适应真实数据分布。数据集提供的双层级标注(语义/实例)支持多种计算机视觉任务评估,包括鱼类检测、计数和行为分析等。为保障实验可比性,建议采用论文所述的80%-10%-10%标准划分方案进行模型训练与验证。
背景与挑战
背景概述
DeepSalmon数据集由NORCE挪威研究中心与罗马尼亚科学院等机构的研究团队于2025年提出,旨在解决水下鲑鱼分割这一海洋水产领域的核心问题。作为当前文献中规模最大的同类数据集(30GB),其包含12段高难度水下视频,通过两阶段无监督分割方法生成合成训练数据,创新性地采用薄板样条形变和颜色直方图匹配技术,将虚拟鱼类逼真融入真实水下环境。该数据集推动了水下图像分析领域的发展,为鱼类行为分析、生物测量等应用提供了重要基准。
当前挑战
该数据集主要面临双重挑战:在领域问题层面,水下环境的光学限制(低可见度、复杂背景干扰)导致传统光学流方法失效,且鱼类相互遮挡加剧了分割难度;在构建过程中,需克服合成数据与真实场景的域差距问题,通过薄板样条模拟鱼类游动形态、直方图匹配实现颜色自适应,确保虚拟标注与真实数据的几何及光度一致性。此外,单帧标注需30-40分钟人工耗时,传统标签传播方法在水下场景失效,促使研究者开发自动化虚拟标注技术。
常用场景
经典使用场景
DeepSalmon数据集在水产养殖和海洋生物学研究中具有重要价值,主要用于解决水下鱼类分割的难题。其经典使用场景包括鱼类行为分析、鱼类数量统计以及鱼类运动轨迹估计。通过提供大量标注数据,该数据集为研究人员提供了一个可靠的基准,用于开发和评估各种水下图像分割算法。特别是在光线条件差、鱼类密集且相互遮挡的复杂水下环境中,DeepSalmon数据集的表现尤为突出。
解决学术问题
DeepSalmon数据集解决了水下鱼类分割领域中的多个关键学术问题。首先,它弥补了现有标注数据不足的缺陷,为无监督和半监督学习方法提供了高质量的训练数据。其次,通过合成数据与真实数据的结合,该数据集有效应对了水下图像质量差、光照条件复杂等挑战。此外,数据集还支持鱼类实例分割和语义分割任务,为鱼类形态学和生态学研究提供了重要工具。
实际应用
在实际应用中,DeepSalmon数据集被广泛用于水产养殖业的自动化监测系统。例如,在鱼类生长监测、健康状况评估以及养殖密度管理中,该数据集支持的高精度分割算法能够显著提升自动化水平。此外,海洋保护机构也利用该数据集进行野生鱼类种群调查,为生态保护政策的制定提供数据支持。
数据集最近研究
最新研究方向
DeepSalmon数据集作为当前水下鱼类分割领域的重要资源,其最新研究方向聚焦于无监督学习与合成数据生成的深度融合。针对水下环境光照不均、能见度低导致的标注数据稀缺问题,该数据集通过虚拟鱼类与真实水下栖息地的智能融合技术,创新性地采用薄板样条形状变形和颜色直方图匹配等变换方法,使合成图像在形态学和光学特性上逼近真实场景。研究热点体现在利用生成式AI构建自动化标注流水线,突破传统监督学习对人工标注的依赖,为鱼类行为分析、种群监测等水产养殖应用提供高精度分割基础。该技术路径通过两阶段无监督训练框架,在DeepFish和DeepSalmon双数据集验证中达到接近全监督模型的性能,显著推动了水下计算机视觉在复杂生态环境中的实用化进程。
相关研究论文
- 1Closer to Ground Truth: Realistic Shape and Appearance Labeled Data Generation for Unsupervised Underwater Image Segmentation挪威科技大学、布加勒斯特理工大学、罗马尼亚科学院数学研究所 · 2025年
以上内容由遇见数据集搜集并总结生成



