TrashCan

Name: TrashCan
Creator: 明尼苏达大学双城分校计算机科学与工程系，明尼苏达机器人研究所
Published: 2020-07-16 12:19:06
License: 暂无描述

arXiv2020-07-16 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2007.08097v1

下载链接

链接失效反馈

官方服务：

资源简介：

TrashCan数据集是由明尼苏达大学双城分校计算机科学与工程系和明尼苏达机器人研究所创建的，旨在通过视觉检测技术解决海洋垃圾问题。该数据集包含7,212张标注图像，涵盖海洋垃圾、ROV及多种海底生物。数据来源于日本海洋地球科学技术厅（JAMSTEC）的J-EDI数据集，通过提取视频帧并使用Supervisely工具进行人工标注。数据集分为TrashCan-Material和TrashCan-Instance两个版本，分别关注垃圾的材料和实例类型。此数据集主要应用于训练深度神经网络，以实现海洋垃圾的自动检测和定位，支持海洋机器人的自主清理任务。

The TrashCan dataset was developed by the Department of Computer Science and Engineering, University of Minnesota Twin Cities, and the Minnesota Robotics Institute, with the goal of addressing marine debris problems via visual detection technologies. It consists of 7,212 annotated images covering marine debris, remotely operated vehicles (ROVs) and various benthic organisms. The dataset is sourced from the J-EDI dataset of the Japan Agency for Marine-Earth Science and Technology (JAMSTEC), with video frames extracted and manually annotated using the Supervisely tool. There are two variants of the dataset: TrashCan-Material and TrashCan-Instance, which focus on the material categories and instance types of marine debris respectively. This dataset is primarily used for training deep neural networks to enable automatic detection and localization of marine debris, supporting autonomous cleanup missions of marine robots.

提供机构：

明尼苏达大学双城分校计算机科学与工程系，明尼苏达机器人研究所

创建时间：

2020-07-16

搜集汇总

数据集介绍

构建方式

TrashCan数据集的构建过程始于从日本海洋地球科学技术机构（JAMSTEC）的深海图像库（J-EDI）中筛选出包含海洋垃圾的视频片段。这些视频片段随后被预处理，每秒提取一帧图像，形成初步的图像集合。接着，这些图像被上传至Supervisely平台，由21名标注员进行逐帧标注，标注内容包括垃圾、ROV、生物体及未知物体的分割掩码。标注过程中，垃圾对象进一步细分为材质和实例类别，生物体则根据其类型进行标注。最终，数据集被转换为COCO格式，分为TrashCan-Material和TrashCan-Instance两个版本，分别基于材质和实例进行分类。

特点

TrashCan数据集的特点在于其丰富的语义分割标注，涵盖了海洋垃圾、ROV及多种海底生物。数据集包含7,212张图像，每张图像均附有详细的分割掩码，标注精度高。此外，数据集提供了两种版本：TrashCan-Material和TrashCan-Instance，分别基于垃圾的材质和实例进行分类，便于不同研究需求的使用。数据集的多样性和详细标注使其成为训练深度学习模型进行海洋垃圾检测的理想选择。

使用方法

TrashCan数据集的使用方法主要包括利用其进行深度学习模型的训练和评估。研究人员可以使用该数据集训练如Mask R-CNN和Faster R-CNN等先进的实例分割和目标检测模型。数据集的两个版本允许用户根据具体需求选择材质或实例分类进行模型训练。此外，数据集提供了基线实验结果，为未来的模型优化和改进提供了参考。通过该数据集，研究人员可以开发出更精确的海洋垃圾检测算法，推动海洋环境保护技术的发展。

背景与挑战

背景概述

TrashCan数据集由明尼苏达大学机器人研究所的Jungseok Hong、Michael Fulton和Junaed Sattar于2020年创建，旨在解决海洋垃圾的视觉检测问题。该数据集包含7,212张水下垃圾图像，标注了实例分割和边界框信息，涵盖了垃圾、ROV（遥控水下机器人）以及多种海底生物。TrashCan的创建源于海洋垃圾对水生生态系统的严重威胁，尤其是水下垃圾的精确检测和定位问题。通过提供大规模、多样化的标注数据，TrashCan为训练深度学习模型（如卷积神经网络）提供了基础，推动了水下自主机器人垃圾检测技术的发展。该数据集分为TrashCan-Material和TrashCan-Instance两个版本，分别基于垃圾材料和实例类型进行分类，为相关领域的研究提供了重要支持。

当前挑战

TrashCan数据集面临的挑战主要体现在两个方面。首先，海洋垃圾的视觉检测本身具有极高的复杂性，垃圾在水下环境中常呈现非刚性形态且易变形，增加了检测的难度。其次，数据集的构建过程也面临诸多挑战，包括从大量水下视频中提取有效帧、标注复杂的水下场景以及处理多样化的垃圾类别。尽管TrashCan提供了实例分割和边界框标注，但其规模仍需进一步扩展以支持更复杂的模型训练。此外，水下环境的复杂光照条件和模糊图像质量也对数据集的标注和模型训练提出了更高的要求。未来研究需在数据集扩展、模型优化以及多模态数据融合等方面持续探索，以提升水下垃圾检测的精度和鲁棒性。

常用场景

经典使用场景

TrashCan数据集在海洋垃圾检测领域具有重要应用，特别是在水下环境中。该数据集通过提供大量带有实例分割和边界框标注的海洋垃圾图像，为训练深度学习模型提供了坚实的基础。研究人员可以利用这些数据开发高效的垃圾检测算法，尤其是在复杂的水下环境中，帮助自主水下机器人（AUVs）精确识别和定位垃圾。

实际应用

在实际应用中，TrashCan数据集为海洋垃圾清理任务提供了重要支持。通过训练基于该数据集的深度学习模型，自主水下机器人能够在复杂的海底环境中高效识别和定位垃圾，从而减少人工清理的成本和风险。此外，该数据集还可用于开发智能垃圾清理系统，帮助环保机构和政府更有效地管理海洋垃圾问题，保护海洋生态系统。

衍生相关工作

TrashCan数据集的发布推动了多项相关研究的发展。基于该数据集，研究人员开发了多种先进的垃圾检测算法，如基于Mask R-CNN和Faster R-CNN的实例分割与目标检测模型。此外，该数据集还激发了生成模型在数据增强中的应用研究，进一步提升了模型的鲁棒性和泛化能力。这些工作为海洋垃圾检测领域奠定了坚实的基础，并为未来的研究提供了丰富的参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集