RT-Pose

Name: RT-Pose
Creator: 国立成功大学，华盛顿大学
Published: 2024-07-19 06:46:35
License: 暂无描述

arXiv2024-07-19 更新2024-07-23 收录

下载链接：

https://huggingface.co/datasets/uwipl/RT-Pose

下载链接

链接失效反馈

官方服务：

资源简介：

RT-Pose数据集由国立成功大学和华盛顿大学联合创建，是一个集成4D雷达张量、LiDAR点云和RGB图像的多模态数据集，专门用于人体姿态估计和定位。该数据集包含72000帧数据，分布在240个序列中，涵盖六种不同复杂度的动作。数据集的创建过程结合了RGB图像和LiDAR点云进行精确的3D人体骨骼标注。RT-Pose数据集主要应用于增强/虚拟现实、人机交互和医疗保健等领域，旨在解决复杂场景下的人体姿态估计问题。

RT-Pose, a multimodal dataset jointly developed by National Cheng Kung University and the University of Washington, integrates 4D radar tensors, LiDAR point clouds and RGB images, and is specifically designed for human pose estimation and localization. It comprises 72,000 frames of data across 240 sequences, covering six action categories with varying levels of complexity. The construction of the RT-Pose dataset leverages RGB images and LiDAR point clouds to generate accurate 3D human skeleton annotations. Primarily applied in domains including augmented/virtual reality, human-computer interaction and healthcare, the RT-Pose dataset aims to address the challenges of human pose estimation in complex scenarios.

提供机构：

国立成功大学，华盛顿大学

创建时间：

2024-07-19

搜集汇总

数据集介绍

构建方式

RT-Pose数据集的构建采用了多模态数据采集方式，包括4D雷达张量、激光雷达点云和RGB图像。数据采集过程在室内外环境中进行，包括多种场景和遮挡条件，确保了数据集的多样性和实用性。数据集包含72k帧图像，跨越240个序列，涵盖了6种不同复杂度的动作。数据预处理包括雷达信号的4D张量处理，以及利用RGB图像和激光雷达点云进行3D人体骨骼的精确标注。

特点

RT-Pose数据集的独特之处在于其融合了4D雷达张量，这种张量提供了原始的时空信息，区别于其他基于雷达点云的数据集。此外，该数据集还包含了丰富的场景和动作，使得模型能够在复杂的真实世界场景中进行评估。数据集的标注流程结合了RGB图像和激光雷达点云，确保了3D人体骨骼标注的准确性。

使用方法

使用RT-Pose数据集时，首先需要了解数据集的结构和标注方式。数据集包含了多模态数据，因此在使用前需要根据研究需求选择合适的数据类型。对于3D人体姿态估计任务，可以使用数据集中的4D雷达张量作为输入，结合激光雷达点云和RGB图像进行标注。此外，数据集还提供了半自动标注工具，有助于提高标注效率和准确性。在进行模型训练和评估时，可以利用数据集中的不同场景和动作进行全面的测试，以确保模型的泛化能力和鲁棒性。

背景与挑战

背景概述

RT-Pose数据集由Yuan-Hao Ho等研究人员于2024年发布，旨在推动基于雷达的人体定位和姿态估计领域的发展。该数据集整合了校准后的4D雷达张量、激光雷达点云和RGB图像，为人体定位和3D姿态估计提供了丰富的数据资源。RT-Pose数据集包含72,000帧图像，涵盖了240个序列，涉及六个不同复杂性的动作。该数据集的独特之处在于提供了原始的时空信息，从而与其他基于雷达点云的数据集区分开来。此外，研究人员还开发了一个基于RGB图像和激光雷达点云的标注流程，以准确标注3D人体骨架。RT-Pose数据集的发布对相关领域的研究产生了深远的影响，为基于雷达的人体定位和姿态估计提供了新的研究方向和实验数据。

当前挑战

RT-Pose数据集和相关研究面临的挑战包括：1) 所解决的领域问题：传统的基于RGB图像的人体定位和姿态估计方法在实际应用中面临着隐私保护的挑战，而基于雷达的方法由于具有穿墙识别和隐私保护等特点，成为了有前景的替代方案。然而，如何利用4D雷达张量进行准确的人体关键点估计仍然是一个挑战。2) 构建过程中所遇到的挑战：4D雷达张量数据量大，每帧数据高达100MB，对计算资源提出了较高的要求。此外，数据收集的范围受到传感器视野的限制，难以在较远的距离上准确捕捉人体姿态。此外，现有的基于雷达的人体姿态估计方法在处理复杂动作时仍然存在困难，需要进一步研究和改进。

常用场景

经典使用场景

RT-Pose数据集是首个整合校准的4D雷达张量、激光雷达点云和RGB图像数据的人体定位和3D姿态估计基准数据集。该数据集包含72k帧，240个序列，涵盖六个不同复杂度的动作，为雷达人体姿态估计提供了丰富的真实场景数据。使用RT-Pose数据集，研究人员可以评估和改进3D人体姿态估计模型的性能，特别是在复杂场景下的准确性。

衍生相关工作

基于RT-Pose数据集，研究人员提出了HRRadarPose模型，这是首个专门用于从4D雷达张量中学习高分辨率表示的单阶段人体姿态估计器。HRRadarPose模型在RT-Pose基准测试中优于之前的雷达人体姿态估计方法，为雷达人体姿态估计领域提供了新的研究方向。此外，RT-Pose数据集的多模态特性也促进了人体行为分析领域的研究，为理解和分析人体运动提供了更全面的数据支持。

数据集最近研究