five

Detecting Underwater Objects (DUO)

收藏
arXiv2021-06-10 更新2024-06-21 收录
下载链接:
https://github.com/chongweiliu
下载链接
链接失效反馈
官方服务:
资源简介:
Detecting Underwater Objects (DUO) 数据集由DUT-RU国际信息科学与工程学院创建,包含7782张多样化的水下图像,这些图像经过去重和重新标注,以提供更合理的标注。数据集主要包含海参、海胆、扇贝和海星四类海洋生物的图像,旨在为水下机器人抓取技术提供关键的定位数据。DUO数据集的创建过程涉及图像去重和使用CNN模型结合人工标注的重新标注。该数据集主要应用于水下机器人抓取领域,解决水下目标检测的准确性和效率问题。

The Detecting Underwater Objects (DUO) dataset was created by the DUT-RU School of International Information Science and Engineering. It comprises 7,782 diverse underwater images that have undergone deduplication and re-annotation to produce more rigorous and reasonable annotations. The dataset primarily includes images of four categories of marine organisms: sea cucumbers, sea urchins, scallops, and starfish, and is designed to provide critical positioning data for underwater robotic grasping technologies. The development of the DUO dataset involves image deduplication as well as re-annotation that combines CNN models with manual labeling. This dataset is mainly applied in the field of underwater robotic grasping, aiming to resolve the challenges regarding accuracy and efficiency in underwater object detection.
提供机构:
DUT-RU国际信息科学与工程学院
创建时间:
2021-06-10
搜集汇总
数据集介绍
main_image_url
构建方式
DUO数据集的构建方法主要分为三个步骤:图像去重、图像重新标注和数据集统计。首先,通过使用感知哈希算法(PHash)对收集到的所有相关数据集中的图像进行去重,以删除重复或过度相似的图像,并保留多样化的水下场景。其次,针对现有标注文件中存在的缺失或错误标签问题,结合CNN模型和人工标注的方式对图像进行重新标注。最后,对数据集的类别比例、实例尺寸分布和每张图像的实例数量进行分析,以了解数据集的统计特征。
特点
DUO数据集的特点主要体现在以下几个方面:1) 数据集包含7782张水下图像,经过去重处理后保留了95%的图像,确保了数据集的多样性和真实性;2) 数据集的标注更加准确,包含四种类型的海洋生物(海参、海胆、扇贝和海星),为水下目标检测任务提供了丰富的标注信息;3) 数据集在MMDetection框架下提供了SOTA检测器的基准测试,包括效率和准确度指标,为学术研究和工业应用提供了参考。
使用方法
DUO数据集的使用方法主要分为以下几个步骤:1) 数据集下载:从GitHub网站下载DUO数据集;2) 数据集准备:将数据集解压并按照目录结构进行组织;3) 数据集预处理:对图像进行缩放、翻转和归一化等操作;4) 模型训练:使用MMDetection框架进行模型训练,并调整相关参数;5) 模型评估:使用数据集提供的基准测试对训练好的模型进行评估,包括准确度和效率指标。
背景与挑战
背景概述
随着水下机器人技术在海洋养殖领域的应用日益广泛,水下目标检测成为机器人抓取任务中的关键技术。然而,现有数据集在测试集标注、数据多样性和标注完整性等方面存在不足,导致研究者在比较不同算法性能时缺乏统一的标准。为了解决这些问题,DUT-RU国际信息科学与工程学院的研究团队于2021年发布了Detecting Underwater Objects (DUO)数据集,并构建了相应的基准。DUO数据集包含了7,782张经过去重和重新标注的水下图像,涵盖了海参、海胆、扇贝和海星四种海洋生物。此外,基于MMDetection框架,研究团队还提供了一个包含效率和精度指标的SOTA检测器基准,为学术研究和工业应用提供了参考。
当前挑战
DUO数据集在解决水下目标检测领域问题的同时,也面临一些挑战。首先,数据集中小型目标的检测难度较大,因为它们在图像中所占比例很小,且水下环境模糊。其次,数据集的分布呈现明显的长尾分布,不同海洋生物的经济价值决定了其养殖数量的差异,导致样本不均衡。此外,为了实现高精度和高效率的检测器,需要设计具有强大多尺度特征融合能力的浅层骨干网络,以及克服长尾分布的特定训练策略,如更合理的正负样本采样机制或类平衡图像分配策略。
常用场景
经典使用场景
在水下物体检测领域,Detecting Underwater Objects (DUO) 数据集以其全面性和准确性著称。它为水下机器人抓取任务提供了宝贵的数据资源,帮助研究人员和工程师开发出更精准、更高效的水下物体检测算法。DUO 数据集包含 7,782 张水下图像,涵盖了海参、海胆、扇贝和海星等四种海洋生物,并提供了更合理的标注,为水下物体检测算法的训练和评估提供了坚实的基础。
解决学术问题
DUO 数据集解决了现有水下物体检测数据集存在的几个关键问题。首先,它提供了一个包含完整测试集标注的统一数据集,避免了研究人员在自我划分测试集时产生的偏差。其次,DUO 数据集通过去除重复图像和重新标注,提高了数据集的质量和多样性,使得训练出的检测模型更具鲁棒性。此外,DUO 数据集还包含了海星这一类别的标注,进一步完善了水下物体检测的数据基础。
衍生相关工作
DUO 数据集的发布激发了水下物体检测领域的研究热潮,催生了大量相关研究工作。基于 DUO 数据集,研究人员探索了各种检测算法,如基于深度学习的目标检测、基于传统图像处理的目标检测等。这些研究工作不仅提高了水下物体检测的准确性和效率,还为水下机器人技术的发展提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作