five

H3WB: Human3.6M 3D WholeBody Dataset|3D姿态估计数据集|计算机视觉数据集

收藏
github2024-05-13 更新2024-05-31 收录
3D姿态估计
计算机视觉
下载链接:
https://github.com/wholebody3d/wholebody3d
下载链接
链接失效反馈
资源简介:
H3WB是一个大规模的3D全身姿态估计数据集,它是Human3.6m数据集的扩展,包含100,000张图像上的133个全身(17个身体、6个脚、68个面部和42个手部)关键点标注。骨骼布局与COCO-Wholebody数据集相同。

H3WB is a large-scale 3D whole-body pose estimation dataset, which is an extension of the Human3.6m dataset. It includes annotations for 133 whole-body keypoints (17 body, 6 foot, 68 face, and 42 hand keypoints) on 100,000 images. The skeletal layout is consistent with that of the COCO-Wholebody dataset.
创建时间:
2022-10-08
原始信息汇总

H3WB数据集概述

数据集描述

  • 名称: H3WB: Human3.6M 3D WholeBody Dataset and Benchmark
  • 类型: 大规模3D全身姿态估计数据集
  • 扩展自: Human3.6m数据集
  • 包含内容: 133个全身关键点(身体17个,脚6个,面部68个,手42个)标注于100,000张图像上
  • 关键点布局: 与COCO-Wholebody数据集相同

数据集下载

  • 图像: 可从Human3.6m数据集官方网站下载
  • 标注: 可从指定链接下载,默认存放于datasets/json/目录下
  • 格式化数据: 提供一种常用格式下载,附带数据准备类,推荐用于实验

标注格式

  • 每个JSON文件包含样本ID、图像路径、边界框、2D关键点和3D关键点信息

预训练模型

  • 数据集附带用于创建数据的预训练模型,模型实现位于models/目录

任务

  • 2D → 3D: 从2D完整全身到3D完整全身的提升
  • I2D → 3D: 从2D不完整全身到3D完整全身的提升
  • RGB → 3D: 从图像到3D完整全身的预测

评估

  • 测试集: 已发布,包含2D到3D和I2D到3D的测试集,每个包含10,000个{图像,2D坐标,3D坐标}三元组
  • 验证: 不提供验证集,鼓励报告5折交叉验证结果

引用信息

  • 引用格式请参考README文件中的BibTeX条目
AI搜集汇总
数据集介绍
main_image_url
构建方式
H3WB数据集是在广泛使用的Human3.6M数据集基础上扩展而成,专门用于3D全身姿态估计。该数据集包含了100,000张图像,每张图像上标注了133个全身关键点,涵盖身体、脚、面部和手部。这些关键点的布局与COCO-WholeBody数据集一致,确保了跨数据集的兼容性。此外,数据集还提供了多种格式的标注文件,包括2D和3D关键点坐标,以及图像路径和边界框信息,便于研究人员在不同任务中使用。
使用方法
使用H3WB数据集时,研究人员可以从官方网站下载图像和标注文件,并使用提供的脚本进行数据预处理。数据集支持多种任务,包括2D到3D的提升、不完整2D到完整3D的提升以及RGB图像到3D的预测。研究人员可以根据具体任务选择相应的训练和测试数据集,并使用提供的预训练模型进行初始化或评估。此外,数据集还提供了可视化工具,帮助研究人员直观地查看和验证3D姿态估计结果。
背景与挑战
背景概述
H3WB(Human3.6M 3D WholeBody Dataset)是一个大规模的3D全身姿态估计数据集,由Yue Zhu、Nermin Samet和David Picard等研究人员于2023年提出,并在ICCV'23会议上发表。该数据集是基于Human3.6M数据集的扩展,包含了10万张图像上的133个全身关键点标注,涵盖身体、脚、面部和手部。H3WB的提出旨在推动3D全身姿态估计领域的发展,并为相关研究提供丰富的数据支持。其关键点布局与COCO-WholeBody数据集一致,进一步扩展了多视角3D姿态估计的应用场景。
当前挑战
H3WB数据集在构建过程中面临多项挑战。首先,3D全身姿态估计需要精确捕捉人体各个部位的复杂运动,尤其是在多视角环境下,如何确保关键点的准确性和一致性是一个技术难题。其次,数据集的扩展涉及大量的人工标注工作,如何提高标注效率和质量也是一大挑战。此外,数据集的多样性和覆盖范围需要广泛,以确保模型在不同场景下的泛化能力。最后,测试集的发布和评估标准的设计,旨在防止数据泄露和确保公平竞争,这也是数据集管理和使用中的重要挑战。
常用场景
经典使用场景
H3WB数据集在3D全身姿态估计领域具有广泛的应用,其经典使用场景包括从2D图像或不完全的2D关键点信息中推断出完整的3D全身姿态。通过提供丰富的关键点标注,该数据集支持多种任务,如2D到3D的姿态提升、不完全2D到3D的姿态提升以及直接从RGB图像预测3D姿态。这些任务在计算机视觉和人体运动分析中具有重要意义,尤其是在需要高精度姿态估计的应用中,如虚拟现实、动作捕捉和人机交互。
解决学术问题
H3WB数据集解决了3D全身姿态估计中的多个关键学术问题,包括如何从有限的2D信息中准确推断出完整的3D姿态,以及如何在多视角和复杂背景下进行精确的姿态重建。该数据集通过提供大规模、高质量的标注数据,推动了相关算法的发展,特别是在处理不完全输入和复杂人体结构时的鲁棒性和准确性。其研究成果对于提升姿态估计技术的理论基础和实际应用具有重要意义。
实际应用
H3WB数据集在多个实际应用场景中展现了其价值,特别是在虚拟现实、动作捕捉和人机交互领域。例如,在虚拟现实中,精确的3D全身姿态估计能够提升用户的沉浸感;在动作捕捉中,该数据集支持高精度的运动数据采集,广泛应用于电影制作和体育分析;在人机交互中,准确的姿态估计有助于开发更自然、直观的交互方式。这些应用场景凸显了H3WB数据集在推动技术进步和实际应用中的重要作用。
数据集最近研究
最新研究方向
H3WB数据集作为Human3.6M的扩展,专注于3D全身姿态估计,近年来在计算机视觉领域引起了广泛关注。其前沿研究方向主要集中在多视角下的全身姿态重建、2D到3D的姿态提升以及不完全2D姿态到完整3D姿态的映射。这些研究不仅推动了姿态估计技术的发展,还在虚拟现实、动作捕捉和人机交互等领域具有重要应用价值。H3WB数据集的发布和不断更新,为研究人员提供了丰富的资源,促进了相关算法的创新与优化,进一步提升了3D姿态估计的精度和鲁棒性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录