UIIS10K
收藏arXiv2025-05-21 更新2025-05-24 收录
下载链接:
https://github.com/LiamLian0727/UIIS10K
下载链接
链接失效反馈官方服务:
资源简介:
UIIS10K数据集是一个包含10,048张水下图像的大规模实例分割数据集,这些图像具有像素级别的注释,涵盖了10个类别,如鱼类、珊瑚、遗迹和人类。该数据集旨在为水下实例分割任务提供一个坚实的基础,促进适应水下环境的模型开发。UIIS10K数据集由互联网和开源水下数据集收集而来,经过筛选、标注和分割,为研究人员提供了一个用于评估水下分割方法的重要基准。UWSAM模型利用Mask GAT-based Underwater Knowledge Distillation (MG-UKD)算法从大型模型中提取知识,并通过End-to-End Underwater Prompt Generator (EUPG)模块自动生成水下提示,从而实现高效的水下实例分割。
The UIIS10K Dataset is a large-scale instance segmentation dataset containing 10,048 underwater images with pixel-level annotations, covering 10 categories including fish, corals, wrecks, and humans. This dataset aims to provide a solid foundation for underwater instance segmentation tasks and facilitate the development of models adapted to underwater environments. The UIIS10K Dataset is collected from the Internet and open-source underwater datasets, and has been screened, annotated and partitioned, serving as an important benchmark for researchers to evaluate underwater segmentation methods. The UWSAM model utilizes the Mask GAT-based Underwater Knowledge Distillation (MG-UKD) algorithm to extract knowledge from large-scale models, and automatically generates underwater prompts via the End-to-End Underwater Prompt Generator (EUPG) module, thereby achieving efficient underwater instance segmentation.
提供机构:
海南大学计算机科学与技术学院, 华中科技大学计算机科学与技术学院, 山东大学控制科学与工程学院, 香港岭南大学数据科学学院
创建时间:
2025-05-21
原始信息汇总
UIIS10K 数据集概述
数据集基本信息
- 名称:UIIS10K
- 发布时间:2025年5月
- 数据规模:10,048张图像
- 标注类型:像素级标注
- 类别数量:10类
- 格式:COCO格式
- 当前地位:已知最大的水下实例分割数据集
数据集内容
- 图像数据:
- 训练集:
train_00001.jpg等 - 测试集:
test_00001.jpg等
- 训练集:
- 标注文件:
- 多类别训练标注:
multiclass_train.json - 多类别测试标注:
multiclass_test.json
- 多类别训练标注:
数据获取方式
- 百度网盘:https://pan.baidu.com/s/1WwDu_jYV8JsPvOGA2l6raQ?pwd=UIIS (密码:UIIS)
- Google Drive:https://drive.google.com/file/d/1MYQwWrQW_n9N-q_VPMuQaroIp5gS2f-u/view?usp=sharing
相关论文
-
WaterMask: Instance Segmentation for Underwater Imagery (ICCV 2023)
- 作者:Shijie Lian等
- 页码:1305-1315
-
UWSAM: Segment Anything Model Guided Underwater Instance Segmentation and A Large-scale Benchmark Dataset (arXiv 2025)
- 作者:Hua Li等
- arXiv编号:2505.15581
搜集汇总
数据集介绍

构建方式
UIIS10K数据集的构建过程分为三个关键步骤:图像收集与筛选、图像标注以及数据集划分。首先,研究团队从互联网和开源水下数据集中收集了约40,000张图像,涵盖深海、浅水、湖泊等多种水下环境场景。经过志愿者筛选后,保留了14,500张高质量图像。随后,利用Segment Anything Model (SAM)和EfficientSAM进行半自动标注,并由16名经过专业培训的志愿者进行人工精修和类别标注。最终,通过多人交叉验证确保标注质量,获得10,048张具有像素级标注的图像。数据集按照8:2的比例划分为训练集(8,083张)和测试集(2,010张),所有标注采用COCO格式存储以确保兼容性。
使用方法
该数据集专为水下实例分割任务设计,可直接用于训练和评估深度学习模型。使用时需注意:1)数据加载需兼容COCO格式标注文件,包含类别标签、实例掩膜和边界框信息;2)建议采用数据增强策略(如随机翻转、缩放)以应对水下图像的颜色失真和尺度变化;3)评估指标推荐采用标准mAP(平均精度)和AP50/AP75,同时针对小/中/大物体分别计算性能;4)针对水下特性,模型设计可结合通道注意力机制处理颜色衰减,或采用图注意力网络捕捉实例集群特征。数据集配套的UWSAM模型展示了端到端使用方法,通过知识蒸馏和自动提示生成实现高效分割。
背景与挑战
背景概述
UIIS10K数据集由海南大学与华中科技大学等机构的研究团队于2025年提出,是目前规模最大的水下实例分割基准数据集,包含10,048张涵盖10类水下目标的像素级标注图像。该数据集旨在解决通用分割模型在水下场景存在的领域适应性问题,其构建受到Segment Anything Model(SAM)在开放世界分割任务中性能局限性的启发。作为水下视觉理解领域的重要基础设施,UIIS10K为海洋遗迹探测、生态监测等应用提供了关键数据支撑,推动了水下实例分割技术向真实复杂场景的落地应用。
当前挑战
UIIS10K主要应对两大核心挑战:在领域问题层面,水下图像存在的光学散射、颜色衰减等退化效应导致目标边界模糊,且珊瑚礁、鱼群等目标的密集分布特性加剧了实例区分难度;在构建过程层面,数据集需解决水下样本的类别不平衡问题(如鱼类与珊瑚占比过高),并通过SAM辅助标注与人工校验相结合的方式确保像素级标注精度,同时需处理不同深度水域图像的分辨率差异与色彩畸变。此外,数据采集还需克服水下拍摄设备动态范围有限导致的曝光异常等问题。
常用场景
经典使用场景
UIIS10K数据集作为当前规模最大的水下实例分割基准数据集,其经典应用场景聚焦于复杂水下环境中的多目标精细化分割任务。在海洋生态调查场景中,该数据集支持对鱼群、珊瑚礁等密集生物群落进行像素级定位与区分,解决了传统方法因水下光学畸变导致的边界模糊问题。其10类标注体系覆盖了从生物群落(如软体动物、节肢动物)到人工物体(如遗迹、机器人)的多样实例,为算法在浑浊水体、低照度等挑战性条件下的鲁棒性评估提供了标准化测试平台。
解决学术问题
该数据集有效解决了水下视觉领域三大核心学术问题:一是通过大规模像素级标注弥补了水下实例分割数据稀缺性,突破了传统方法在小样本场景下的泛化瓶颈;二是针对水下特有的光衰减、散射效应,提供了颜色失真校正与特征学习的基准依据,如通过通道强度统计量化了红绿蓝波段的衰减差异;三是提出了基于实例尺寸分级(小/中/大)的评估体系,推动了多尺度目标分割算法的发展。其构建过程中采用的SAM辅助标注策略,也为弱监督学习在水下领域的应用提供了方法论参考。
实际应用
在实际应用层面,UIIS10K直接支撑了海洋资源勘探、水下考古机器人导航等关键场景。在深海遗迹探测中,数据集训练的模型可精准分割腐蚀严重的沉船结构;于生态监测领域,其细粒度分类能力支持对珊瑚白化程度的量化分析。特别在AUV(自主水下航行器)实时作业中,轻量化版本UWSAM通过知识蒸馏技术实现了边缘设备部署,在保持90%精度的同时将参数量压缩至ViT-Small的47M,显著提升了水下人机协同效率。
数据集最近研究
最新研究方向
近年来,水下实例分割领域的研究取得了显著进展,特别是在大规模模型和知识蒸馏技术的应用方面。UIIS10K数据集的提出为水下实例分割任务提供了重要的基准,其包含10,048张带有像素级标注的图像,覆盖了10个类别,如鱼类、珊瑚、遗迹等。这一数据集的规模和质量使其成为评估水下分割方法的重要工具。前沿研究方向包括基于Segment Anything Model(SAM)的高效知识蒸馏技术,如Mask GAT-based Underwater Knowledge Distillation(MG-UKD),以及端到端的水下提示生成器(EUPG)。这些技术不仅提升了模型在复杂水下环境中的分割精度,还显著降低了计算复杂度,使其更适合在资源受限的水下平台上部署。此外,水下实例分割技术在海洋生态探索、水下考古和人机交互等应用中展现出广阔前景。
相关研究论文
- 1UWSAM: Segment Anything Model Guided Underwater Instance Segmentation and A Large-scale Benchmark Dataset海南大学计算机科学与技术学院, 华中科技大学计算机科学与技术学院, 山东大学控制科学与工程学院, 香港岭南大学数据科学学院 · 2025年
以上内容由遇见数据集搜集并总结生成



