USIS10K dataset
收藏github2024-05-05 更新2024-05-31 收录
下载链接:
https://github.com/LiamLian0727/USIS10K
下载链接
链接失效反馈官方服务:
资源简介:
We construct the first large-scale USIS10K dataset for the underwater salient instance segmentation task, which contains 10,632 images and pixel-level annotations of 7 categories. As far as we know, this is the largest salient instance segmentation dataset available that simultaneously includes Class-Agnostic and Multi-Class labels.
本团队构建了首个大规模的USIS10K水下显著实例分割数据集,该数据集包含10,632幅图像及其7个类别的像素级标注。据我们所知,这是目前可获得的规模最大的同时包含无类别和多重类别标签的显著实例分割数据集。
创建时间:
2024-05-02
原始信息汇总
数据集概述
数据集名称
- USIS10K
数据集特点
- 规模: USIS10K是首个用于水下显著实例分割任务的大规模数据集,包含10,632张图像。
- 标注: 提供像素级标注,涵盖7个类别,同时包含类别无关和多类别标签。
- 应用: 专为水下显著实例分割任务设计,是目前最大的显著实例分割数据集。
数据集结构
-
文件夹结构:
data ├── USIS10K ├── foreground_annotations │ ├── foreground_train_annotations.json │ ├── foreground_val_annotations.json │ ├── foreground_test_annotations.json ├── multi_class_annotations │ ├── multi_class_train_annotations.json │ ├── multi_class_val_annotations.json │ ├── multi_class_test_annotations.json ├── train │ ├── train_00001.jpg │ ├── ... ├── val │ ├── val_00001.jpg │ ├── ... ├── test │ ├── test_00001.jpg │ ├── ...
数据集获取
模型与性能
- 模型: USIS-SAM,首个尝试应用Segment Anything Model于水下显著实例分割的模型。
- 性能: 通过广泛的公共评估标准和大量实验验证,USIS10K数据集和USIS-SAM模型有效性得到确认。
- 测试结果:
- Class-Agnostic: mAP 64.3, AP50 84.9, AP75 74.0
- Multi-Class: mAP 43.9, AP50 59.6, AP75 50.0
搜集汇总
数据集介绍

构建方式
在海洋科学和计算机视觉的交叉领域,USIS10K数据集的构建标志着一项重大进展。该数据集由10,632张图像组成,涵盖了7个类别的像素级标注,旨在支持水下显著实例分割任务。其构建过程包括对大量水下图像的采集、标注以及分类,确保了数据集的高质量和多样性。此外,数据集同时包含了类别无关和多类别标签,使其成为当前最大的显著实例分割数据集之一。
使用方法
使用USIS10K数据集进行研究或开发时,首先需下载数据集并将其放置在项目的`data`目录下。数据集的结构清晰,包含训练、验证和测试集,以及相应的标注文件。用户可以通过修改配置文件中的路径来指定数据集的位置。此外,数据集支持与MMDetection框架的无缝集成,用户可以参考其文档进行数据集的准备和模型的训练。对于模型的训练和测试,提供了详细的命令行接口和配置文件,确保用户能够高效地进行实验和验证。
背景与挑战
背景概述
USIS10K数据集是由Shijie Lian等研究人员于2024年创建,旨在解决水下显著实例分割任务。该数据集包含10,632张图像和像素级标注的7个类别,是目前最大的显著实例分割数据集,同时包含类别无关和多类别标签。该数据集的构建标志着水下图像处理领域的一个重要里程碑,为复杂水下场景中的实例分割提供了丰富的资源和基准。
当前挑战
USIS10K数据集在构建过程中面临多重挑战。首先,水下环境的复杂性和多样性使得图像采集和标注变得极为困难。其次,数据集的规模和多样性要求高效的标注和处理工具,以确保标注的准确性和一致性。此外,水下图像的低对比度和模糊特性增加了分割算法的难度,需要开发新的模型和技术来提高分割精度。最后,数据集的公开和使用也面临数据隐私和版权保护的挑战。
常用场景
经典使用场景
USIS10K数据集在海洋科学和计算机视觉领域中,主要用于水下显著实例分割任务。该数据集包含10,632张图像和像素级标注,涵盖7个类别,是迄今为止最大的显著实例分割数据集之一。通过结合Segment Anything Model(SAM),USIS10K数据集能够显著提升复杂水下场景中的分割精度,为水下图像分析和目标识别提供了强有力的支持。
解决学术问题
USIS10K数据集解决了水下图像处理中的关键学术问题,即在复杂水下环境中进行高精度的显著实例分割。传统方法在处理水下图像时常常面临光照不均、颜色失真等问题,而USIS10K通过大规模数据集和先进的SAM模型,有效提升了分割的准确性和鲁棒性。这一进展对于海洋生态监测、水下机器人导航等领域具有重要意义。
实际应用
在实际应用中,USIS10K数据集及其相关模型USIS-SAM在水下机器人、海洋生物监测和海底资源勘探等领域展现出巨大潜力。例如,水下机器人可以利用该数据集进行自主导航和目标识别,提高作业效率和安全性;海洋生物学家则可以借助其进行物种分类和行为分析,推动海洋生态研究。
数据集最近研究
最新研究方向
在海洋科学与计算机视觉的交叉领域,USIS10K数据集的引入为水下显著实例分割任务提供了前所未有的资源。该数据集不仅包含了10,632张图像和像素级别的7类标注,还首次实现了类无关和多类标签的同时标注,使其成为目前最大的显著实例分割数据集。前沿研究方向主要集中在利用USIS10K数据集优化水下场景中的实例分割模型,特别是通过结合Segment Anything Model(SAM)技术,提出USIS-SAM模型,以提升在复杂水下环境中的分割精度。这一研究不仅推动了水下图像处理技术的发展,也为海洋生态监测和资源管理提供了新的工具和方法。
以上内容由遇见数据集搜集并总结生成



