SMPL Mannequin Benchmark

Name: SMPL Mannequin Benchmark
Creator: NAVER LABS Europe
Published: 2020-12-05 01:48:32
License: 暂无描述

arXiv2020-12-05 更新2024-06-21 收录

下载链接：

https://europe.naverlabs.com/research/computer-vision/mannequin-benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

SMPL Mannequin Benchmark是由NAVER LABS Europe创建的一个包含24,428帧图像的数据集，用于评估在自然环境中的3D人体姿态估计。该数据集利用Mannequin Challenge数据集中的静态人体视频，通过结构从运动技术精确拟合SMPL模型。数据集涵盖多种身体姿态、外观和环境，包括室内外场景，自然遮挡和近距离拍摄。创建过程涉及人体实例的跟踪和分割，3D点云重建，以及SMPL模型的优化拟合。该数据集主要用于评估和改进3D人体姿态估计方法，特别是在自然环境中的应用，如虚拟/增强现实和机器人技术。

The SMPL Mannequin Benchmark is a dataset containing 24,428 image frames, developed by NAVER LABS Europe for evaluating 3D human pose estimation in natural environments. It leverages static human videos from the Mannequin Challenge dataset, and accurately fits the SMPL model via structure-from-motion (SfM) techniques. The dataset covers diverse body poses, visual appearances and environmental scenarios, including both indoor and outdoor scenes, natural occlusions and close-up shots. Its creation involves human instance tracking and segmentation, 3D point cloud reconstruction, and optimized fitting of the SMPL model. This benchmark is primarily used to evaluate and improve 3D human pose estimation methods, especially for real-world applications such as virtual/augmented reality and robotics.

提供机构：

NAVER LABS Europe

创建时间：

2020-12-05

搜集汇总

数据集介绍

构建方式

在三维人体姿态估计领域，构建具有精确真实标注的野外数据集一直面临挑战。SMPL Mannequin Benchmark通过创新性流程，巧妙利用Mannequin Challenge数据集中人物静止、相机移动的特性。该流程首先对视频序列进行人体实例分割与跟踪，随后运用运动恢复结构技术生成三维点云，并利用人体分割结果进行清洗。核心步骤在于结合DensePose提供的像素与SMPL表面对应关系，通过优化框架将SMPL模型拟合到点云上，同时施加姿态在帧间保持恒定的约束。最终，通过重投影检查、可见性验证及人工核查三重后处理，从567个场景中精选出24,428帧带有注册人体模型的数据，以极低成本构建了大规模高质量标注集。

特点

该数据集显著特点在于其标注的精确性与场景的真实性。所有数据均来源于自然场景下的在线RGB视频，涵盖了室内外多样环境，包含自然遮挡、人物截断及复杂背景。数据集提供了基于SMPL参数化模型的完整三维人体形状与姿态真值，并附有关节可见性信息，这对于评估遮挡情况下的算法鲁棒性至关重要。与同类野外数据集相比，其包含742个不同主体，在主体数量和场景多样性上均提升了一到两个数量级，且无需特殊采集设备，仅凭普通手持设备即可扩展，体现了高度的可扩展性与实用性。

使用方法

该数据集主要用于评测基于SMPL的三维人体姿态与形状估计算法。研究者可将算法预测的SMPL参数或三维关节坐标与数据集提供的真值进行比较。评估指标包括三维空间中的平均每关节位置误差、不同阈值下的三维关键点正确百分比及其曲线下面积，以及二维投影误差。使用时需注意数据集中提供的关节可见性标签，可在评估时屏蔽不可见关节以进行公平比较。该数据集特别适合用于分析算法在复杂野外场景、部分遮挡、困难姿态及不同身体倾斜角度下的性能表现，从而揭示现有方法的局限性与未来改进方向。

背景与挑战

背景概述

SMPL Mannequin Benchmark 由 NAVER LABS Europe 的研究团队于2020年提出，旨在解决三维人体姿态估计在自然场景中的评估难题。该数据集基于 Mannequin Challenge 视频资源，通过多视角几何约束与 SMPL 参数化人体模型相结合，构建了包含24,428帧图像、涵盖567个场景和742个不同人体的高精度三维姿态真值。其核心研究问题聚焦于在无约束环境下实现准确、可扩展的三维人体姿态与形状估计，推动了计算机视觉在增强现实、人机交互等领域的应用发展。

当前挑战

该数据集主要应对三维人体姿态估计在自然场景中的两大挑战：一是领域问题的挑战，即如何准确估计在复杂环境（如遮挡、截断、姿态多样性）下的人体三维姿态与形状，现有方法在遮挡严重或姿态非常规时仍易出现显著误差；二是构建过程中的挑战，涉及从单目视频中恢复静态人体的精确三维模型，需克服运动模糊、视频压缩噪声、多视角一致性约束的优化难题，并依赖 DensePose 等中间表示的稳定性以确保真值质量。

常用场景

经典使用场景

在计算机视觉领域，三维人体姿态估计的研究常受限于高质量真实标注数据的稀缺。SMPL Mannequin Benchmark 通过利用 Mannequin Challenge 数据集中的静态人体视频，结合运动恢复结构技术，为野外环境下的三维人体姿态估计提供了精准的基准。该数据集的核心应用场景在于评估基于 SMPL 参数化模型的姿态估计算法，特别是在复杂自然场景中的性能表现。研究者可借助该数据集验证算法在遮挡、截断及多样姿态下的鲁棒性，推动三维人体理解技术的边界拓展。

衍生相关工作

该数据集的推出催生了一系列重要的后续研究，尤其是在提升三维人体姿态估计的鲁棒性与准确性方面。基于此基准，学者们进一步探索了时序信息融合、对抗性训练以及多模态数据联合优化等方向。例如，VIBE 方法通过利用视频时序信息显著提升了姿态估计的稳定性；SPIN 等算法结合了学习与优化策略，在复杂场景中取得了优异性能。这些工作不仅深化了对野外环境下人体姿态估计挑战的理解，也为后续更高效、更通用的三维人体建模方法奠定了坚实基础。

数据集最近研究