RGBD1K

Name: RGBD1K
Creator: 江南大学人工智能与计算机科学学院
Published: 2022-12-31 07:23:37
License: 暂无描述

arXiv2022-12-31 更新2024-06-21 收录

下载链接：

https://github.com/xuefeng-zhu5/RGBD1K

下载链接

链接失效反馈

官方服务：

资源简介：

RGBD1K是一个大规模的RGB-D对象跟踪数据集，由江南大学人工智能与计算机科学学院创建。该数据集包含1050个序列，总计约250万帧，旨在解决现有RGB-D跟踪数据集的不足问题。数据集内容丰富，涵盖多种对象类别和场景，支持室内外环境的跟踪任务。创建过程中，数据集通过ZED立体相机捕捉，确保RGB和深度帧的时间同步和像素对齐。RGBD1K的应用领域广泛，主要用于提升RGB-D跟踪算法的性能，特别是在处理复杂场景和目标外观变化时的跟踪能力。

RGBD1K is a large-scale RGB-D object tracking dataset created by the School of Artificial Intelligence and Computer Science, Jiangnan University. It contains 1050 sequences, totaling approximately 2.5 million frames, and aims to address the shortcomings of existing RGB-D tracking datasets. The dataset features rich content, covers a wide range of object categories and scenarios, and supports tracking tasks in both indoor and outdoor environments. During its creation, the dataset was captured using ZED stereo cameras, ensuring temporal synchronization and pixel alignment between RGB and depth frames. RGBD1K has broad application domains, and is mainly used to improve the performance of RGB-D tracking algorithms, especially their tracking capabilities when dealing with complex scenarios and target appearance variations.

提供机构：

江南大学人工智能与计算机科学学院

创建时间：

2022-08-21

搜集汇总

数据集介绍

构建方式

在RGB-D对象跟踪领域，现有的数据集规模有限，难以支持深度学习模型的离线训练。为解决这一问题，RGBD1K数据集应运而生。该数据集包含1,050个序列，总计约250万帧。其中，1,000个序列用于训练，50个序列用于测试。为降低标注成本，训练集中的每个视频仅标注前600帧，而测试集中的所有帧均被标注。此外，每帧还标注了15个挑战性属性，以促进跟踪器在复杂场景中的性能分析。

使用方法

RGBD1K数据集适用于各种RGB-D对象跟踪任务的研究和开发。研究者可以使用该数据集进行模型的训练和验证，特别是在深度学习框架下，利用大规模标注数据提升跟踪器的性能。此外，数据集中的挑战性属性标注为跟踪器在特定场景下的性能评估提供了有力支持，有助于推动RGB-D跟踪技术的发展。

背景与挑战

背景概述

近年来，RGB-D目标跟踪因其结合视觉和深度通道的协同作用而备受关注，并取得了显著的性能提升。然而，由于标注的RGB-D跟踪数据有限，大多数最先进的RGB-D跟踪器仅仅是高性能RGB跟踪器的简单扩展，未能充分利用深度通道在离线训练阶段的潜在优势。为解决数据集不足的问题，本文发布了一个名为RGBD1K的新RGB-D数据集。RGBD1K包含1050个序列，总计约250万帧。为展示在更大RGB-D数据集上训练的益处，特别是RGBD1K，我们开发了一个基于transformer的RGB-D跟踪器，名为SPT，作为未来视觉目标跟踪研究的基线。通过使用SPT跟踪器进行的大量实验结果表明，RGBD1K数据集具有提升RGB-D跟踪性能的潜力，激发了未来有效跟踪器设计的进一步发展。

当前挑战

RGBD1K数据集的构建面临多重挑战。首先，现有的RGB-D跟踪方法通常基于高性能的RGB跟踪器，仅在在线跟踪阶段利用深度信息来支持部分遮挡目标的推理和消失目标的重检测，而未能在离线训练阶段充分利用深度通道的潜力。其次，公开的标注RGB-D视频数据无法支持RGB-D跟踪网络的离线训练，导致RGB-D跟踪器的进展不如RGB跟踪器迅速。此外，现有RGB-D数据集的规模远不足以推动RGB-D跟踪的快速发展。为应对这些挑战，RGBD1K数据集通过收集大量室内外场景的RGB-D视频序列，提供了丰富的训练和测试数据，旨在促进RGB-D跟踪技术的研究与应用。

常用场景

经典使用场景

RGBD1K数据集的经典使用场景主要集中在RGB-D对象跟踪任务中。该数据集包含1,050个序列，总计约250万帧，为深度学习和计算机视觉领域的研究人员提供了丰富的RGB-D视频数据。通过利用RGB和深度通道的协同作用，研究人员可以开发和评估新的跟踪算法，特别是在复杂场景下的目标跟踪，如部分遮挡、光照变化和快速运动等挑战性条件下。

解决学术问题

RGBD1K数据集解决了当前RGB-D跟踪领域中训练数据不足的问题。由于现有的RGB-D数据集规模较小，大多数先进的RGB-D跟踪器仅仅是高性能RGB跟踪器的简单扩展，未能充分利用深度通道在离线训练阶段的潜力。RGBD1K的发布为研究人员提供了一个大规模、多样化的数据集，促进了RGB-D跟踪技术的发展，推动了深度学习在视觉对象跟踪中的应用。

实际应用

RGBD1K数据集在实际应用中具有广泛的前景，特别是在需要高精度目标跟踪的场景中，如机器人导航、增强现实、智能家居和自动驾驶等。通过提供丰富的RGB-D视频数据，该数据集有助于开发更鲁棒和精确的跟踪算法，从而提高这些应用的性能和可靠性。此外，RGBD1K还支持多视角和多场景的跟踪任务，增强了算法的泛化能力和实际应用价值。

数据集最近研究