five

Harmony4D

收藏
github2024-10-26 更新2024-10-27 收录
下载链接:
https://github.com/jyuntins/harmony4d
下载链接
链接失效反馈
官方服务:
资源简介:
Harmony4D是一个用于野外近距离人类交互的多视角视频数据集,包含摔跤、舞蹈、MMA等动态活动。数据集使用灵活的多视角捕捉系统记录这些动态活动,并提供人类检测、跟踪、2D/3D姿态估计和网格恢复的注释。

Harmony4D is a multi-view video dataset for close-range human interactions in unconstrained outdoor scenes, covering dynamic activities such as wrestling, dancing, and Mixed Martial Arts (MMA). The dataset is captured using a flexible multi-view acquisition system, and provides annotations for human detection, tracking, 2D/3D pose estimation and mesh recovery.
创建时间:
2024-10-25
原始信息汇总

Harmony4D: A Video Dataset for In-The-Wild Close Human Interactions

概述

  • 名称: Harmony4D
  • 发布机构: Carnegie Mellon University
  • 作者:
    • Rawal Khirodkar
    • Jyun-Ting Song
    • Jinkun Cao
    • Zhengyi Luo
    • Kris Kitani
  • 贡献: 等同贡献

数据集详情

  • 类型: 多视角视频数据集
  • 主题: 人类互动,包括摔跤、舞蹈、MMA等活动
  • 环境: 野外环境
  • 数据量:
    • 1.66 百万张图像
    • 3.32 百万个人类实例
    • 208 个视频序列
    • 20 个同步摄像头
    • 24 个独特主体

数据特点

  • 标注:
    • 人体检测
    • 跟踪
    • 2D/3D 姿态估计
    • 网格恢复
  • 算法:
    • 无标记算法用于在严重遮挡和近距离互动中跟踪3D人体姿态
  • 评估:
    • 对现有最先进方法进行严格评估
    • 在严重遮挡和接触场景中,HMR2.0模型在Harmony4D上微调后,PVE性能提升至54.8%

项目页面

数据链接

联系方式

搜集汇总
数据集介绍
main_image_url
构建方式
在构建Harmony4D数据集时,研究团队采用了一种灵活的多视角捕捉系统,以记录多样化的野外活动,如摔跤、舞蹈和综合格斗等。该系统通过超过20个同步摄像头,捕捉了208个视频序列,涵盖了不同的环境和24个独特的参与者。为了确保数据的准确性和完整性,团队开发了一种无标记的3D人体姿态追踪算法,用于处理严重遮挡和近距离互动场景,从而实现了对人类检测、追踪、2D/3D姿态估计和网格恢复的精确标注。
特点
Harmony4D数据集的显著特点在于其广泛的应用场景和高质量的标注。该数据集包含了1.66百万张图像和3.32百万个人类实例,提供了丰富的多视角视频数据。此外,数据集的标注不仅包括基础的检测和追踪,还涵盖了复杂的3D姿态估计和网格恢复,特别适用于研究近距离互动和严重遮挡情况下的行为分析。
使用方法
使用Harmony4D数据集时,用户首先需要按照提供的安装指南进行环境配置。随后,可以通过下载链接获取数据集文件,并利用可视化工具对数据进行初步探索。为了充分利用数据集的丰富标注,用户可以采用现有的先进算法进行模型训练,如HMR2.0模型,该模型在数据集上进行了微调,显著提升了在复杂场景中的表现。
背景与挑战
背景概述
在虚拟现实系统中,理解人类之间的互动行为是构建真实感多人体系统的关键。然而,由于缺乏大规模的数据集,这一领域仍处于相对未探索的状态。现有的数据集主要集中在受控的室内环境中,且活动多为编排好的,这极大地限制了其多样性。为了解决这一问题,Carnegie Mellon University的研究团队在2024年推出了Harmony4D数据集。该数据集专注于捕捉自然环境中的近距离人类互动,如摔跤、舞蹈和综合格斗等。通过使用灵活的多视角捕捉系统,Harmony4D提供了包括人体检测、跟踪、2D/3D姿态估计和网格恢复在内的详细标注。这一数据集的推出,不仅填补了现有数据集的空白,还为研究者提供了一个强大的工具,以推动多人体互动建模的发展。
当前挑战
Harmony4D数据集在构建过程中面临了多项挑战。首先,捕捉自然环境中的动态互动需要高度灵活的多视角系统,这增加了数据采集的复杂性。其次,由于互动场景中存在严重的遮挡和接触,传统的3D姿态跟踪算法难以有效应用。为此,研究团队开发了一种新的无标记算法,以减少手动干预并提高标注的准确性。此外,数据集的多样性和规模也带来了存储和处理上的挑战,特别是在评估现有最先进方法时,发现其在处理近距离互动场景时存在显著局限。尽管如此,通过在Harmony4D上微调预训练的HMR2.0模型,研究团队展示了在严重遮挡和接触场景中性能的显著提升,为未来的研究提供了新的方向。
常用场景
经典使用场景
在虚拟现实和增强现实领域,Harmony4D数据集为研究者提供了一个丰富的资源,用于分析和模拟人类在自然环境中的近距离互动。该数据集通过多视角视频捕捉,记录了如摔跤、舞蹈和综合格斗等动态活动,为开发更逼真的多人体互动系统奠定了基础。研究者可以利用这些数据进行人体检测、跟踪、2D/3D姿态估计以及网格恢复等任务,从而推动虚拟环境中人类行为的自然再现。
实际应用
Harmony4D数据集在多个实际应用场景中展现出巨大潜力。例如,在体育分析中,教练和分析师可以利用该数据集来研究运动员的互动和动作,从而优化训练策略。在娱乐产业中,开发者可以利用这些数据来创建更逼真的虚拟角色和互动场景,提升用户体验。此外,该数据集还可应用于安全监控和行为分析,帮助识别和预测潜在的危险行为。
衍生相关工作
Harmony4D数据集的发布激发了大量相关研究工作。例如,基于该数据集的3D姿态估计和网格恢复算法得到了显著改进,特别是在处理复杂互动场景时。此外,研究者还开发了新的模型和方法,用于更精确地捕捉和模拟人类行为。这些工作不仅推动了虚拟现实和增强现实技术的发展,还为其他相关领域如人机交互和行为科学提供了新的研究工具和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作