five

Voxel51/MPII_Human_Pose_Dataset

收藏
Hugging Face2024-05-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Voxel51/MPII_Human_Pose_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
MPII Human Pose数据集是一个用于评估人体姿态估计的先进基准数据集。该数据集包含约25,000张图像,覆盖了410种日常人类活动,每张图像都带有活动标签。图像从YouTube视频中提取,并提供了前后未标注的帧。测试集包含更丰富的注释,如身体部位遮挡和3D躯干和头部方向。数据集的结构和注释过程也在文件中详细描述。

MPII Human Pose数据集是一个用于评估人体姿态估计的先进基准数据集。该数据集包含约25,000张图像,覆盖了410种日常人类活动,每张图像都带有活动标签。图像从YouTube视频中提取,并提供了前后未标注的帧。测试集包含更丰富的注释,如身体部位遮挡和3D躯干和头部方向。数据集的结构和注释过程也在文件中详细描述。
提供机构:
Voxel51
原始信息汇总

数据集概述

名称: MPII Human Pose
版本: 1.0
语言: 英语
许可证: BSD-2-Clause
样本数量: 24,984
任务类别:

  • 图像分类
  • 目标检测 标签:
  • MPII Human Pose
  • fiftyone
  • image
  • image-classification
  • object-detection
  • version1

数据集描述

MPII Human Pose 数据集是一个用于评估关节人体姿态估计的先进基准。该数据集包含约25,000张图像,涵盖超过40,000个人体,并标注了身体关节。这些图像根据日常人类活动的既定分类法系统收集,覆盖了410种人类活动,并为每张图像提供了活动标签。每张图像均从YouTube视频中提取,并附有前后的未标注帧。测试集还包含了更丰富的标注,包括身体部位遮挡和3D躯干及头部方向。

数据集结构

媒体类型: 图像
样本字段:

  • id
  • filepath
  • tags
  • metadata
  • rectangle_id
  • activity
  • head_rect
  • objpos
  • scale
  • annopoints
  • video_id
  • frame_sec

数据集来源

网站: http://human-pose.mpi-inf.mpg.de/
论文: http://human-pose.mpi-inf.mpg.de/contents/andriluka14cvpr.pdf

使用

数据集主要用于以下任务:

  • 多人姿态估计
  • 单人姿态估计

引用信息

BibTeX:

@inproceedings{andriluka14cvpr, author = {Mykhaylo Andriluka and Leonid Pishchulin and Peter Gehler and Schiele, Bernt} title = {2D Human Pose Estimation: New Benchmark and State of the Art Analysis}, booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)}, year = {2014}, month = {June} }

搜集汇总
数据集介绍
main_image_url
构建方式
在人体姿态估计领域,MPII Human Pose数据集以其系统化的构建方式而著称。该数据集从YouTube视频中提取了约25,000幅图像,涵盖了410种日常人类活动,每幅图像均附有活动标签。通过建立详尽的人类活动分类体系,确保了数据采集的全面性与代表性。每幅图像不仅包含标注的人体关节点,还提供了前后未标注的帧序列,以支持时序分析。测试集进一步丰富了注释内容,包括身体部位遮挡信息以及三维躯干和头部方向,为模型评估提供了更全面的基准。
使用方法
使用MPII Human Pose数据集时,研究人员可通过FiftyOne工具便捷地加载与探索数据。首先安装FiftyOne库,随后利用其HuggingFace集成功能导入数据集。数据集支持图像分类与目标检测任务,用户可访问样本字段如活动标签、关节点坐标及视频元数据。通过启动FiftyOne应用程序,能够直观浏览图像及其注释,进行数据可视化与初步分析。该数据集适用于训练和评估人体姿态估计模型,尤其适合研究多人与单人姿态估计的先进算法。
背景与挑战
背景概述
MPII Human Pose数据集由马克斯·普朗克信息学研究所于2014年发布,作为二维人体姿态估计领域的里程碑式基准。该数据集由Mykhaylo Andriluka等研究人员主导构建,旨在通过系统化收集的日常人类活动图像,推动姿态估计算法的精确性与鲁棒性发展。其核心研究问题聚焦于单人与多人姿态的精准识别,涵盖了410种人类活动类别,包含约2.5万幅图像及超过4万人的关节点标注。该数据集的问世,显著提升了计算机视觉领域对人体姿态理解的技术边界,为后续研究提供了丰富的实验基础与评估标准。
当前挑战
在领域问题层面,MPII Human Pose数据集致力于应对复杂场景下的人体姿态估计挑战,包括遮挡处理、尺度变化、多样姿态及多人交互的精准解析。构建过程中,研究人员面临数据采集的系统性难题,需从YouTube视频中提取具有代表性的日常活动帧,并建立细致的人类活动分类体系。标注工作亦具挑战性,需确保超过4万人体关节点的空间位置与可见性标注的一致性,同时为测试集补充三维躯干方向等丰富注释,以支撑算法的深入评估。
常用场景
经典使用场景
在计算机视觉领域,人体姿态估计作为理解人类行为的关键技术,MPII Human Pose数据集凭借其丰富的标注信息成为该领域的基准测试集。该数据集广泛应用于单人与多人姿态估计模型的训练与评估,通过包含日常活动场景的图像,为算法提供了多样化的姿态变化和遮挡情况,从而推动模型在复杂环境下的鲁棒性提升。
解决学术问题
该数据集有效解决了人体姿态估计中因视角变化、肢体遮挡和活动多样性导致的识别难题。通过提供精确的关节标注和活动标签,它促进了基于深度学习的方法在姿态估计精度上的突破,并为评估模型泛化能力设立了标准,从而推动了计算机视觉在人体运动分析方面的理论进展。
实际应用
在实际应用中,MPII Human Pose数据集为智能监控、人机交互和运动分析等场景提供了数据支持。例如,在体育科学中,可用于分析运动员动作规范性;在医疗康复领域,辅助评估患者运动功能;其丰富的视频帧数据还能用于行为识别系统的开发,提升自动化系统的感知能力。
数据集最近研究
最新研究方向
在人体姿态估计领域,MPII Human Pose数据集作为经典基准,持续推动着前沿技术的发展。当前研究聚焦于多模态融合与三维姿态重建,结合深度学习模型如Transformer架构,以提升复杂场景下的姿态识别精度。数据集涵盖的410种日常活动为行为理解提供了丰富语境,促进了动作识别与场景交互的交叉研究。随着计算机视觉向具身智能演进,该数据集在机器人感知、虚拟现实等热点应用中扮演关键角色,其标注的关节可见性与三维方向信息为遮挡处理和姿态预测提供了重要支撑,持续影响着算法评估与模型泛化能力的提升。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作