Digital Twin Tracking Dataset (DTTD)

Name: Digital Twin Tracking Dataset (DTTD)
Creator: 加州大学伯克利分校
Published: 2023-04-12 04:31:38
License: 暂无描述

arXiv2023-04-12 更新2024-06-21 收录

下载链接：

https://github.com/augcog/DTTDv1

下载链接

链接失效反馈

官方服务：

资源简介：

Digital Twin Tracking Dataset (DTTD) 是一个专为增强现实(AR)中的数字孪生应用设计的高质量3D物体跟踪数据集。该数据集由加州大学伯克利分校创建，包含10个具有丰富纹理的常见物品在103个不同场景中的数据。数据集使用最新的Microsoft Azure Kinect ToF相机采集，确保了高分辨率和大视野，同时提供了精确的密集深度图。数据收集涵盖了从0.7米到1.5米的广泛距离，并模拟了多种真实世界的光照条件。此外，DTTD还开发了一个新颖的数据标注流程，利用OptiTrack运动捕捉系统提供每帧的像素级语义分割和物体姿态的地面实况标注。该数据集旨在推动未来物体跟踪方法的研究，并分析在更长距离和更广泛光照条件下的新挑战。

Digital Twin Tracking Dataset (DTTD) is a high-quality 3D object tracking dataset specifically designed for digital twin applications in augmented reality (AR). This dataset was created by the University of California, Berkeley, and contains data of 10 common textured objects across 103 distinct scenarios. Captured using the state-of-the-art Microsoft Azure Kinect ToF camera, it ensures high resolution and a wide field of view, while providing accurate dense depth maps. The data collection covers a broad distance range from 0.7 meters to 1.5 meters, and includes simulations of various real-world lighting conditions. In addition, DTTD employs a novel data annotation pipeline that utilizes the OptiTrack motion capture system to provide per-frame pixel-level semantic segmentation and ground-truth annotations for object poses. This dataset is intended to advance research on future object tracking methods, and analyze new challenges posed by longer detection distances and more diverse lighting conditions.

提供机构：

加州大学伯克利分校

创建时间：

2023-02-13

搜集汇总

数据集介绍

构建方式

在增强现实与数字孪生技术蓬勃发展的背景下，Digital Twin Tracking Dataset (DTTD) 的构建旨在填补长距离、高精度三维物体跟踪数据集的空白。该数据集采用微软Azure Kinect飞行时间（ToF）相机作为采集设备，以其高分辨率（1280×720）和低噪声深度图特性，在0.7至1.5米范围内捕捉对齐的RGB与深度帧。数据采集于室内环境，涵盖103个场景，涉及10种常见纹理丰富的物体，并在不同光照与遮挡条件下进行录制。为确保标注精度，研究团队创新性地结合了OptiTrack运动捕捉系统与ARUCO标记进行外参校准，通过迭代最近点（ICP）配准与人工细化流程，为每一帧提供毫米级精度的物体位姿真值及逐像素语义分割标签。

特点

DTTD数据集的核心特点在于其专为数字孪生应用设计的真实性与挑战性。与以往侧重于机器人抓取的短距离数据集不同，DTTD的平均观测距离扩展至1.32米，并引入了复杂的光照变化，模拟了增强现实应用中的实际环境。数据集提供的深度数据得益于先进的ToF传感器，点云噪声显著降低，且深度图更为稠密。此外，数据集中包含几何形状相同但纹理不同的物体对，为研究外观特征与几何特征的分离提供了条件。所有标注均经过自动化与人工双重校验，确保了标签的高质量与一致性，为算法在长距离、多变光照下的鲁棒性评估设立了新的基准。

使用方法

为促进三维物体姿态估计研究，DTTD提供了完整的数据使用与评估框架。数据集已公开划分训练集与测试集，分别包含92个和11个视频序列中提取的关键帧，并额外提供两万张合成图像以扩充训练数据。研究者可利用开源代码库中的数据处理管道，将深度图反投影为三维点云，并加载物体纹理模型进行算法开发。评估遵循领域内通用标准，采用ADD与ADD-S平均距离度量，并通过计算不同阈值下的曲线下面积（AUC）来综合评估算法性能。数据集支持对DenseFusion、FFB6D等前沿方法进行基准测试，尤其有助于分析算法在长距离观测及光照变化下的表现，为数字孪生跟踪系统的研发提供关键实验平台。

背景与挑战

背景概述

数字孪生追踪数据集（DTTD）由加州大学伯克利分校的研究团队于2023年创建，旨在推动增强现实（AR）与数字孪生领域的六自由度物体姿态估计研究。该数据集聚焦于解决传统三维物体追踪在长距离、毫米级精度及复杂光照条件下的局限性，通过采用先进的微软Azure Kinect飞行时间（ToF）相机，采集了10种常见纹理物体的103个场景数据。DTTD不仅提供了高分辨率的RGB-D图像，还通过商用运动捕捉系统实现了像素级语义分割与精确姿态标注，为AR应用中的实时物体追踪奠定了新的基准。

当前挑战

在领域问题层面，DTTD致力于应对数字孪生应用中长距离物体追踪的挑战，包括在1.5米范围内实现毫米级定位精度、适应多变光照条件以及处理物体遮挡问题，这些要求超越了现有数据集如YCB-Video的厘米级精度局限。构建过程中，研究团队面临深度传感器噪声控制、多传感器时间同步、以及高精度姿态标注的复杂性。通过集成OptiTrack运动捕捉系统与ARUCO标记校准，DTTD在减少点云噪声与标注误差方面取得了突破，但数据采集与标注流程仍需大量人工干预以保障质量。

常用场景

经典使用场景

在增强现实与数字孪生领域，三维物体跟踪是实现虚实融合的核心技术。Digital Twin Tracking Dataset (DTTD) 作为专为长距离物体跟踪设计的RGB-D数据集，其经典使用场景聚焦于在复杂光照与遮挡条件下，对室内环境中常见物体进行毫米级精度的六自由度姿态估计。该数据集通过采用先进的飞行时间深度传感器，在0.7至1.5米范围内采集高分辨率对齐图像与深度图，为算法提供了模拟真实AR交互场景的丰富数据基础，从而推动数字孪生系统中实时、鲁棒的三维跟踪方法的发展。

衍生相关工作

基于DTTD数据集，研究者已开展多项经典工作，进一步拓展了三维物体跟踪的技术边界。例如，DenseFusion及其结合abc损失的变体在该数据集上验证了L1正则化对提升非对称物体姿态估计鲁棒性的作用；FFB6D等关键点检测方法则被用于探索长距离下RGB-D特征融合的有效性。这些工作不仅深化了对深度数据质量、光照不变性及算法效率的理解，还催生了针对数字孪生场景的新颖网络架构与评估指标，为后续研究提供了重要的算法比较与性能分析基础。

数据集最近研究