five

USIS16K|水下图像识别数据集|图像分割数据集

收藏
github2025-06-26 更新2025-06-27 收录
水下图像识别
图像分割
下载链接:
https://github.com/LinHong-HIT/USIS16K
下载链接
链接失效反馈
资源简介:
USIS16K是一个高质量的大规模数据集,包含16,151张高分辨率水下图像,涵盖158种不同的水下物体类别。每张图像中的显著物体通过眼动数据识别,并用高质量的实例级掩码进行标注。该数据集免费用于学术研究,不可用于商业用途。
创建时间:
2025-06-18
原始信息汇总

USIS16K数据集概述

数据集基本信息

  • 名称: USIS16K
  • 类型: 水下显著实例分割数据集
  • 规模: 16,151张高分辨率水下图像
  • 对象类别: 158种不同的水下物体
  • 标注方式: 使用眼动数据识别显著对象,并提供高质量的实例级掩码标注
  • 分辨率: 高分辨率(具体数值未提供)
  • 数据来源: 真实海洋环境

数据集特点

  • 高质量: 所有图像均为高质量采集
  • 多样性: 涵盖广泛真实水下环境
  • 代表性: 包含158种常见水下物体类别
  • 层次分类系统: 采用分层分类法系统组织对象

数据获取与使用

  • 获取方式: 通过Google Drive下载(链接:https://drive.google.com/file/d/1SIfpJe7rpeL6ZsRzD9ir0mRsKRYehjxb/view?usp=drive_link)
  • 使用限制: 仅限学术研究使用,禁止商业用途
  • 建议划分比例: 训练集:验证集:测试集 ≈ 7:2:1

基准测试

  • 测试方法:
    • 重训练了8种目标检测方法
    • 10种实例分割模型(基于MMDetection框架)
    • 专用模型WaterMask和USIS-SAM
  • 结果说明: 12种代表性方法的定性评估结果已展示

相关论文

  • 标题: USIS16K: High-Quality Dataset for Underwater Salient Instance Segmentation
  • 作者: Lin Hong, Xin Wang, Yihao Li, Xia Wang
  • arXiv链接: https://arxiv.org/abs/2506.19472
  • 年份: 2025
  • 分类: cs.CV

引用格式

bibtex @misc{hong2025usis16khighqualitydatasetunderwater, title={USIS16K: High-Quality Dataset for Underwater Salient Instance Segmentation}, author={Lin Hong and Xin Wang and Yihao Li and Xia Wang}, year={2025}, eprint={2506.19472}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2506.19472}, }

研究目标

  • 联合解决水下视觉中的两个关键挑战:
    1. 显著区域预测(where to look)
    2. 实例分割(what is there)
  • 促进海洋计算机视觉和海洋机器人领域的研究
AI搜集汇总
数据集介绍
main_image_url
构建方式
USIS16K数据集的构建过程体现了严谨的科学方法论,研究团队通过真实海洋环境中采集的16,151张高分辨率水下图像,构建了这一大规模数据集。特别值得注意的是,数据集中显著对象的标注基于眼动追踪数据,确保了标注的准确性和可靠性。随后,研究团队采用实例级掩码对这些对象进行了高质量标注,并按照7:2:1的比例划分训练集、验证集和测试集,以保证模型的训练和评估效果。
特点
USIS16K数据集以其高质量和多样性著称,涵盖了158种常见水下物体类别,并通过分层分类系统进行系统化组织。数据集的图像覆盖了广泛的真实海洋环境,显著对象的标注基于眼动追踪数据,确保了标注的准确性和可靠性。此外,数据集的规模和高分辨率特性为水下显著实例分割任务提供了丰富的研究素材。
使用方法
USIS16K数据集专为学术研究设计,适用于水下显著实例分割任务的研究。研究人员可以按照数据集提供的7:2:1划分比例进行模型训练和评估。数据集支持多种深度学习方法的评估,包括目标检测和实例分割模型。使用前需注意数据集的非商业用途限制,并引用相关论文以尊重研究团队的贡献。
背景与挑战
背景概述
USIS16K数据集由香港科技大学的Lin Hong等人于2025年创建,旨在推动水下显著实例分割领域的研究。该数据集包含16,151张高分辨率水下图像,覆盖158种典型水下物体类别,通过眼动追踪技术标注了高质量的实例级掩码。作为首个专注于水下环境的多任务视觉数据集,USIS16K创新性地将显著物体检测与实例分割相结合,为海洋计算机视觉和机器人领域提供了关键基准工具。其层次化分类体系和严格的数据划分策略,显著提升了水下场景理解的细粒度研究水平。
当前挑战
水下显著实例分割面临双重技术挑战:复杂水下环境导致的光学畸变、低对比度等成像问题严重干扰显著性检测精度;而珊瑚、藻类等非刚性物体的形态多样性则增加了实例分割的边界判定难度。在数据集构建层面,需克服真实场景样本采集成本高、眼动标注一致性维护困难等实际问题。USIS16K通过多设备协同采集和专家交叉验证,确保了158类物体在训练集、验证集和测试集中的均衡分布,为模型泛化能力评估建立了可靠标准。
常用场景
经典使用场景
USIS16K数据集作为水下显著实例分割领域的高质量基准数据集,广泛应用于海洋计算机视觉研究中。其16,151张高分辨率水下图像覆盖158种不同类别的水下物体,为深度学习模型提供了丰富的训练样本。该数据集通过眼动追踪数据标注显著对象,并辅以高质量的实例级掩码,成为评估目标检测和实例分割算法性能的理想平台。特别是在复杂水下环境中,该数据集能够有效测试模型对模糊、低对比度目标的识别能力。
解决学术问题
USIS16K数据集解决了水下视觉研究中两个关键学术问题:显著目标定位与实例精确分割。传统水下图像分析受限于数据规模和质量,难以支撑深度学习方法的应用。该数据集通过系统化的分层分类体系和精确标注,为水下场景理解提供了可靠的数据基础。其意义在于推动了水下目标检测从粗粒度识别向细粒度实例分割的范式转变,对海洋生物监测、水下机器人导航等研究具有重要支撑作用。
衍生相关工作
围绕USIS16K数据集已衍生出多项重要研究工作,包括专门优化的WaterMask模型和USIS-SAM架构。该数据集被广泛用于验证MMDetection框架中目标检测算法的水下适应性,推动了水下视觉专用网络的创新。相关研究不仅改进了传统实例分割模型在水下的表现,还催生了融合显著性检测与分割任务的新型算法范式,为跨模态水下感知奠定了方法学基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

日食计算器

此日食计算器能够查询公元前3000至后3000年范围内的日食信息,生成每次日食的覆盖区、中心区范围数据,展示日食带的地图;并可根据用户在地图上点击的坐标在线计算该地日食各阶段时间、食分等观测信息。

国家天文科学数据中心 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

TongueDx Dataset

TongueDx数据集是一个专为远程舌诊研究设计的综合性舌象图像数据集,由香港理工大学和新加坡管理大学的研究团队创建。该数据集包含5109张图像,涵盖了多种环境条件下的舌象,图像通过智能手机和笔记本电脑摄像头采集,具有较高的多样性和代表性。数据集不仅包含舌象图像,还提供了详细的舌面属性标注,如舌色、舌苔厚度等,并附有受试者的年龄、性别等人口统计信息。数据集的创建过程包括图像采集、舌象分割、标准化处理和多标签标注,旨在解决远程医疗中舌诊图像质量不一致的问题。该数据集的应用领域主要集中在远程医疗和中医诊断,旨在通过自动化技术提高舌诊的准确性和可靠性。

arXiv 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录

MIDV-500

该数据集包含使用移动设备拍摄的不同文档图像,这些图像通常具有投影变形。数据集分为训练和测试两部分,其中训练部分包含30种文档类型,测试部分包含20种,在应用神经网络之前,所有图像都被缩放到统一的宽度,宽度为400像素。该数据集的任务是进行消失点检测。

arXiv 收录