five

USIS10K

收藏
arXiv2024-06-10 更新2024-06-12 收录
下载链接:
https://github.com/LiamLian0727/USIS10K
下载链接
链接失效反馈
官方服务:
资源简介:
USIS10K是由海南大学等机构创建的首个大规模水下显著实例分割数据集,包含10,632张来自不同水下场景的图像,每张图像都有像素级别的显著实例标注,涵盖7个类别。数据集的创建过程涉及从互联网和开放源数据集中精选图像,并通过至少3名志愿者的投票确保标注的准确性和客观性。USIS10K的应用领域包括海洋遗迹发现、海洋资源探索、水下人机交互和水下图像理解,旨在解决水下显著实例分割的挑战,提高水下视觉任务的准确性。

USIS10K is the first large-scale underwater salient instance segmentation dataset created by institutions including Hainan University. It contains 10,632 images from diverse underwater scenes, each with pixel-level salient instance annotations covering 7 categories. The dataset was developed by selecting images from the internet and open-source datasets, and ensuring annotation accuracy and objectivity through votes from at least 3 volunteers. The application fields of USIS10K include marine relic discovery, marine resource exploration, underwater human-computer interaction and underwater image understanding, aiming to address the challenges in underwater salient instance segmentation and improve the accuracy of underwater visual tasks.
提供机构:
海南大学
创建时间:
2024-06-10
搜集汇总
数据集介绍
main_image_url
构建方式
在海洋视觉研究领域,构建高质量数据集是推动算法发展的基石。USIS10K数据集的构建过程体现了严谨的科学方法,研究团队从互联网及开源水下数据集中精心筛选了约16,000幅图像,覆盖了海洋探索、人机协作等多种水下视觉任务场景。为确保标注的准确性与客观性,每幅图像均由至少三名经过专业训练的志愿者进行像素级标注,并通过投票机制确定最终标注结果。经过严格的质量控制,包括剔除标注不一致或类别模糊的图像,最终形成了包含10,632幅图像的数据集,所有标注均采用主流的COCO格式存储,便于后续研究使用。
特点
USIS10K数据集作为首个大规模水下显著实例分割数据集,具有鲜明的领域特色与学术价值。该数据集涵盖了鱼类、珊瑚礁、水生植物、人类潜水员、机器人、水下遗迹及海底礁石等七类对象,共计10,632幅图像,并同时提供了类别无关与多类别标注,极大拓展了其在下游任务中的应用潜力。数据集中16.3%的图像包含三个以上显著实例,显著实例的平均尺寸约占图像面积的10.3%,且存在大量尺寸极端(小于1%或大于30%图像面积)的实例,这些特性共同构成了对现有分割方法的严峻挑战。此外,水下环境特有的颜色衰减、局部对比度低以及实例聚集等现象,进一步提升了数据集的复杂性与研究价值。
使用方法
USIS10K数据集为水下显著实例分割任务提供了标准化的评估基准。研究者可按照7:1.5:1.5的比例划分训练集、验证集与测试集,利用其提供的像素级掩码、边界框及类别标签进行模型训练与性能验证。该数据集支持类别无关分割与多类别分割两种任务模式,便于全面评估模型在定位显著区域与预测实例类别方面的综合能力。基于该数据集提出的USIS-SAM架构展示了典型的使用范例,其通过水下自适应视觉Transformer编码器融入领域视觉提示,并利用显著特征提示生成器自动产生提示,引导端到端的分割网络,为后续研究提供了可借鉴的技术路线。
背景与挑战
背景概述
随着大模型技术的突破,Segment Anything Model(SAM)及其扩展在计算机视觉的多样化任务中展现出广泛应用潜力。水下显著实例分割作为水下视觉任务的基础与关键环节,常因复杂的水下环境与模型适应性不足而导致分割精度低下。此外,缺乏大规模像素级标注的数据集也制约了该领域机器学习技术的发展。为此,研究团队于2024年构建了首个大规模水下显著实例分割数据集USIS10K,包含来自多样水下场景的10,632张图像,涵盖鱼类、珊瑚礁、水下植物等七类对象的像素级标注。该数据集由海南大学、香港科技大学(广州)等机构的研究人员联合创建,旨在推动水下视觉任务如海洋遗迹发现、资源勘探等领域的进步,为模型训练与评估提供了重要基准。
当前挑战
USIS10K数据集致力于解决水下显著实例分割这一领域核心问题,其挑战主要体现在两方面:一是水下图像固有的质量退化问题,如波长衰减、散射效应及海洋雪花噪声,导致图像对比度低、边界模糊,增加了实例分割的难度;二是数据构建过程中的技术挑战,包括大规模像素级标注的耗时性与一致性要求,需通过多志愿者标注与投票机制确保标注精度,同时克服水下场景中实例类别多样、尺寸差异大以及局部颜色对比度不足等复杂因素,以构建具有代表性和挑战性的基准数据集。
常用场景
经典使用场景
在海洋视觉研究领域,USIS10K数据集为水下显著实例分割任务提供了首个大规模基准。该数据集包含七类水下场景的像素级标注图像,涵盖鱼类、珊瑚礁、水生植物等典型对象,其经典应用场景在于训练和评估深度学习模型在复杂水下环境中的分割性能。通过提供多样化的水下图像样本,USIS10K使得研究者能够系统探索模型对光线散射、颜色失真及海洋噪声等挑战的适应性,从而推动水下计算机视觉技术的精细化发展。
实际应用
在实际应用层面,USIS10K数据集为海洋资源勘探、水下机器人导航、海底遗迹发现等任务提供了关键技术支撑。基于该数据集训练的模型能够自动识别并分割水下图像中的显著目标,辅助海洋生物监测、水下设备操控及环境调查。例如,在自主水下航行器中,集成USIS10K驱动的分割算法可实现实时障碍物检测与路径规划,提升水下作业的安全性与效率,推动海洋工程与生态保护的智能化进程。
衍生相关工作
围绕USIS10K数据集,研究者提出了多种创新方法,其中USIS-SAM架构尤为突出。该工作通过设计水下自适应视觉变换器编码器和显著特征提示生成器,将SAM模型有效迁移至水下领域。此外,基于该数据集的扩展研究包括水下协同显著实例分割、多任务联合学习等方向,促进了如RSPrompter、WaterMask等经典工作的性能优化与跨领域应用,为水下视觉模型的泛化能力与实用性奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作