SLOPER4D

arXiv2023-03-18 更新2024-06-21 收录

下载链接：

http://www.lidarhumanmotion.net/sloper4d/

下载链接

链接失效反馈

官方服务：

资源简介：

SLOPER4D是一个大规模场景感知数据集，用于城市环境中全球4D人体姿态估计研究。该数据集由厦门大学、上海科技大学和马克斯·普朗克智能系统研究所合作创建，包含15个运动序列，覆盖超过2000平方米至13000平方米的区域，总距离超过8公里。数据集内容丰富，包括超过10万帧LiDAR数据、30万视频帧和50万基于IMU的运动帧。创建过程中，使用头戴式LiDAR和相机捕捉12名受试者在10个多样城市场景中的活动，并提供帧级2D关键点、3D姿态参数及全球平移标注。SLOPER4D旨在解决大规模动态场景中的人体姿态估计问题，特别适用于增强/虚拟现实、自动驾驶和智能城市等领域的研究。

SLOPER4D is a large-scale scene-aware dataset developed for research on global 4D human pose estimation in urban environments. It was collaboratively constructed by Xiamen University, ShanghaiTech University, and the Max Planck Institute for Intelligent Systems. The dataset contains 15 motion sequences, covering areas ranging from over 2,000 to 13,000 square meters, with a total traversed distance exceeding 8 kilometers. It boasts a rich array of data, including over 100,000 LiDAR frames, 300,000 video frames, and 500,000 IMU-based motion frames. During the data collection process, head-mounted LiDAR sensors and cameras were used to capture the activities of 12 human subjects across 10 diverse urban scenarios, and frame-level 2D keypoints, 3D pose parameters, as well as global translation annotations are provided. SLOPER4D aims to address the challenge of human pose estimation in large-scale dynamic scenes, and is particularly suitable for research in fields such as augmented/virtual reality, autonomous driving, and smart cities.

提供机构：

厦门大学, 中国上海科技大学, 中国马克斯·普朗克智能系统研究所, 德国

创建时间：

2023-03-16

搜集汇总

数据集介绍

构建方式

在复杂城市环境下的全局人体姿态估计研究中，数据采集与标注的精确性构成了关键基础。SLOPER4D数据集的构建采用了创新的头戴式多传感器融合方案，通过集成激光雷达、摄像头与惯性测量单元，对12名受试者在10个多样化城市场景中的活动进行同步采集。其核心在于提出了一种联合优化方法，通过融合激光雷达SLAM结果、IMU姿态与场景几何约束，逐帧优化SMPL人体网格与场景的拟合，并精细调整动态运动过程中的相机外参，从而在广阔动态场景中获得了精确且符合场景物理规律的三维人体姿态真值。

特点

作为首个面向城市场景的大规模多模态人体姿态数据集，SLOPER4D的突出特点在于其前所未有的规模与丰富的标注信息。数据集包含超过15个运动序列，轨迹总长逾8公里，覆盖面积最大达13,000平方米，提供了超过10万帧激光雷达点云、30万帧视频图像及50万帧IMU运动数据。其标注体系极为完备，不仅包含二维关键点、三维姿态参数和全局平移，还提供了重建的三维场景点云网格，实现了人体运动与静态场景在统一世界坐标系下的精准对齐，为研究人-场景交互提供了坚实基础。

使用方法

SLOPER4D数据集为计算机视觉领域，特别是户外全局人体姿态估计研究，提供了全新的评估基准。研究者可利用其多模态数据，分别开展基于单目视频的3D HPE、基于激光雷达点云的3D HPE以及全局人体姿态估计等核心任务的算法开发与性能评测。数据集已划分为标准的训练集与测试集，并提供了MPJPE、PA-MPJPE、绝对轨迹误差等多项评估指标。通过将预测的人体网格或姿态与数据集提供的精确全局真值进行定量比较，能够有效推动面向真实复杂环境的感知算法发展。

背景与挑战

背景概述

SLOPER4D数据集于2023年由厦门大学、上海科技大学及德国马克斯·普朗克智能系统研究所的研究团队联合构建，旨在推动城市环境中全局4D人体姿态估计的研究。该数据集聚焦于解决复杂开放场景下人体与环境的交互问题，通过头戴式激光雷达与相机系统，采集了12名受试者在10个不同城市场景中的活动数据。作为首个大规模、多模态的城市场景感知人体姿态数据集，SLOPER4D提供了包含全局平移、三维姿态参数及重建场景点云在内的丰富标注，为增强现实、自动驾驶及智慧城市等下游应用奠定了关键数据基础，显著拓展了人体运动捕捉的研究边界。

当前挑战

SLOPER4D致力于解决城市场景中全局人体姿态估计这一核心挑战，其难点在于如何在动态、大范围且结构复杂的户外环境中，精确恢复具有物理世界全局位置信息的连续人体运动。构建过程中的挑战尤为突出：多传感器数据的高精度同步与校准面临技术瓶颈，尤其是在动态运动导致设备非刚性连接时，外参标定极易产生误差；此外，从稀疏且不完整的激光雷达点云中注册完整的人体网格，传统方法如迭代最近点算法效果有限，需设计新颖的视角相关损失函数；同时，在超大规模场景中融合惯性测量单元、激光雷达与视觉数据，并施加场景物理约束以优化获得自然合理的人体运动，构成了极其复杂的联合优化问题。

常用场景

经典使用场景

在计算机视觉与增强现实领域，SLOPER4D数据集为全球4D人体姿态估计研究提供了关键支撑。该数据集通过头戴式激光雷达与相机系统，在图书馆、商业街、足球场等十类复杂城市场景中，采集了超过八公里轨迹的多模态时序数据。其经典应用场景集中于驱动算法在动态大尺度环境中实现人体运动的三维重建与全局定位，为探索人-场景交互机制奠定了数据基础。

衍生相关工作

SLOPER4D的发布催生了一系列围绕全局人体姿态估计的创新研究。基于其多模态特性，后续工作深化了激光雷达点云与单目视频在户外人体重建中的融合策略。该数据集也被用于改进如GLAMR等动态相机下的全局人体网格恢复算法，并启发了对场景接触、物理合理性等约束的进一步探索。同时，它推动了新基准任务的建立，促使研究社区关注长时序、大尺度轨迹下的姿态估计精度与鲁棒性问题。

数据集最近研究