Human3.6M|3D人体姿态估计数据集|计算机视觉数据集

OpenDataLab2025-04-05 更新2024-05-09 收录

3D人体姿态估计

计算机视觉

下载链接：

https://opendatalab.org.cn/OpenDataLab/Human3_dot_6m

下载链接

链接失效反馈

资源简介：

多样性和大小 • 360 万张 3D 人体姿势和相应图像 • 11 位专业演员（6 男，5 女） • 17 种场景（讨论、吸烟、拍照、打电话……）准确捕捉和同步 • 高分辨率来自 4 个校准摄像机的 50Hz 视频 • 来自高速运动捕捉系统的准确 3D 关节位置和关节角度 • 每种配置的像素级 24 个身体部位标签 • 飞行时间范围数据。

提供机构：

OpenDataLab

创建时间：

2022-03-17

AI搜集汇总

数据集介绍

构建方式

Human3.6M数据集是通过在受控环境中使用多视角摄像机系统捕捉人体动作而构建的。该数据集包含了360万帧的高分辨率视频，涵盖了11名专业演员在15个不同场景中的动作。每个动作序列都经过精细的标注，包括2D和3D关节位置，以及深度信息。这些数据是通过先进的计算机视觉技术从视频中提取并校准的，确保了数据的高精度和一致性。

使用方法

Human3.6M数据集广泛应用于计算机视觉和机器学习领域，特别是在人体动作分析和姿态估计的研究中。研究人员可以利用该数据集训练和验证各种模型，如卷积神经网络（CNN）和递归神经网络（RNN），以提高动作识别和姿态预测的准确性。此外，数据集的多视角和多场景特性，使得模型能够在不同的环境和视角下进行泛化测试，从而提升其实际应用的可靠性。

背景与挑战

背景概述

Human3.6M数据集，由Ionescu等人于2014年发布，是人体运动分析领域的一个重要里程碑。该数据集包含了360万帧的高分辨率视频，涵盖了11名专业演员在15种日常活动中的表现，如行走、坐下、站立等。通过使用多视角摄像系统，Human3.6M提供了精确的三维人体姿态估计，极大地推动了计算机视觉和机器学习在人体运动分析中的应用。其丰富的数据和高质量的标注，使得研究人员能够开发和验证更为复杂和精确的姿态估计模型，从而在医疗、体育科学和人机交互等多个领域产生了深远的影响。

当前挑战

尽管Human3.6M数据集在人体运动分析领域具有重要地位，但其构建过程中也面临了诸多挑战。首先，多视角摄像系统的同步和校准要求极高，以确保三维姿态估计的准确性。其次，数据集的规模庞大，处理和存储这些高分辨率视频数据对计算资源提出了严峻的要求。此外，由于人体运动的复杂性和多样性，确保标注的准确性和一致性也是一个巨大的挑战。最后，如何有效地利用这些数据进行模型训练，以提高姿态估计的精度和鲁棒性，仍然是当前研究的热点问题。

发展历史

创建时间与更新

Human3.6M数据集于2014年由Ionescu等人首次发布，旨在为人体运动分析提供一个全面且高质量的数据资源。该数据集自发布以来，经历了多次更新和扩展，以适应不断发展的研究需求和技术进步。

重要里程碑

Human3.6M数据集的发布标志着人体运动分析领域的一个重要里程碑。其首次引入了高精度的3D人体姿态估计数据，极大地推动了相关算法的发展。随后，数据集的扩展版本引入了更多的动作类别和参与者，进一步丰富了研究内容。此外，Human3.6M还成为了多个国际竞赛和挑战的标准数据集，促进了全球范围内研究者的交流与合作。

当前发展情况

当前，Human3.6M数据集已成为人体运动分析领域的基石，广泛应用于计算机视觉、机器学习和人机交互等多个前沿领域。其高质量的数据为算法验证和模型训练提供了坚实的基础，推动了3D姿态估计、动作识别和运动预测等技术的快速发展。随着深度学习技术的进步，Human3.6M数据集的应用范围不断扩大，为智能监控、虚拟现实和人机协作等新兴应用场景提供了重要的技术支持。

发展历程

Human3.6M数据集首次发表，由Ionescu等人提出，旨在为人体动作捕捉和姿态估计研究提供一个大规模、高质量的数据集。
2014年
Human3.6M数据集首次应用于深度学习领域，特别是在卷积神经网络（CNN）和递归神经网络（RNN）的姿态估计任务中，展示了其在人体动作分析中的潜力。
2015年
Human3.6M数据集被广泛用于多种人体姿态估计和动作识别算法的研究，成为该领域的一个基准数据集。
2016年
随着深度学习技术的进步，Human3.6M数据集在三维人体姿态估计任务中的应用进一步深化，推动了相关算法的性能提升。
2017年
Human3.6M数据集开始被用于多视角和多模态数据融合的研究，以提高人体姿态估计的精度和鲁棒性。
2018年
Human3.6M数据集在实时人体姿态估计和动作捕捉系统中的应用逐渐增多，促进了相关技术的商业化进程。
2019年
Human3.6M数据集继续作为人体动作分析和姿态估计研究的重要资源，支持了多种新型算法的开发和验证。
2020年

常用场景

经典使用场景

在计算机视觉领域，Human3.6M数据集被广泛用于人体姿态估计的研究。该数据集包含了360万帧的高分辨率视频，涵盖了11名专业演员在15种日常活动中的姿态数据。通过这些丰富的数据，研究人员能够开发和验证各种姿态估计算法，从而提高模型在复杂场景下的准确性和鲁棒性。

解决学术问题

Human3.6M数据集解决了人体姿态估计中的关键学术问题，如多视角下的姿态一致性、复杂背景下的姿态识别以及动态场景中的姿态跟踪。通过提供高质量的多视角视频数据，该数据集帮助研究人员开发出更加精确和鲁棒的姿态估计模型，推动了计算机视觉领域的发展。

实际应用

在实际应用中，Human3.6M数据集的应用场景广泛，包括但不限于虚拟现实、增强现实、人机交互和运动分析。例如，在虚拟现实中，精确的姿态估计可以提升用户的沉浸感；在人机交互中，准确的姿态识别可以实现更加自然和高效的交互方式。

数据集最近研究

相关研究论文

1
Human3.6M: Large Scale Datasets and Predictive Methods for 3D Human Sensing in Natural EnvironmentsEcole Polytechnique Fédérale de Lausanne (EPFL) · 2013年
2
3D Human Pose Estimation in the Wild by Adversarial LearningUniversity of Adelaide · 2018年
3
Monocular 3D Human Pose Estimation In The Wild Using Improved CNN SupervisionUniversity of Adelaide · 2017年
4
Learning to Estimate 3D Human Pose and Shape from a Single Color ImageUniversity of Pennsylvania · 2018年
5
End-to-end Recovery of Human Shape and PoseUniversity of California, Berkeley · 2018年

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

CatMeows

该数据集包含440个声音样本，由21只属于两个品种（缅因州库恩猫和欧洲短毛猫）的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定，包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外，还有一个额外的zip文件，包含被排除的录音（非喵声）和未剪辑的连续发声序列。

huggingface 收录

中国区域地面气象要素驱动数据集 v2.0（1951-2020）

中国区域地面气象要素驱动数据集（China Meteorological Forcing Data，以下简称 CMFD）是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素，时间分辨率为 3 小时，水平空间分辨率为 0.1°，时间长度为 70 年（1951~2020 年），覆盖了 70°E~140°E，15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据，并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品，其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展，其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本，而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集，但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外，在制作 CMFD 2.0 的过程中，研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息，显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时，CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年，并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同，但其有效数据扩展到了中国之外，能够更好地支持跨境区域研究。为方便用户使用，CMFD 2.0 还在基础变量集之外提供了若干衍生变量，包括近地面相对湿度、雨雪分离降水产品等。此外，CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术，转而直接将实型数据压缩存储于 NetCDF4 格式文件中，从而消除了用户使用数据时进行解压换算的困扰。本数据集原定版本号为 1.7，但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变，故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致，仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新，以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中，计划于 2025 年上半年发布，从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心收录

MedDialog

MedDialog数据集（中文）包含了医生和患者之间的对话（中文）。它有110万个对话和400万个话语。数据还在不断增长，会有更多的对话加入。原始对话来自好大夫网。

github 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息，包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

HIT-UAV

HIT-UAV数据集是由中国科学院计算技术研究所分布式系统研究中心创建，专注于无人机（UAV）基于高海拔红外热成像的目标检测。该数据集包含2898张从数百个视频中提取的43470帧红外热图像，涵盖学校、停车场、道路和游乐场等多种场景。数据集不仅提供图像，还记录了飞行高度、相机视角、日期和日光强度等关键飞行数据。每张图像均手动标注了两种类型的边界框（定向和标准），以应对航空图像中目标实例显著重叠的挑战。HIT-UAV旨在解决夜间操作和隐私问题，是首个公开可用的高海拔UAV红外热数据集，用于检测人员和车辆，适用于多种UAV应用和研究，如夜间搜索和救援任务、飞行高度与目标检测精度的关系研究等。

arXiv 收录