five

Harmony4D

收藏
arXiv2024-10-27 更新2024-10-30 收录
下载链接:
https://jyuntins.github.io/harmony4d/
下载链接
链接失效反馈
官方服务:
资源简介:
Harmony4D是由卡内基梅隆大学创建的一个大规模多视角视频数据集,专注于野外近距离人类互动,如摔跤、舞蹈、MMA等。该数据集包含166万张图像和332万个可见人体实例,由超过20个同步摄像头捕捉,涵盖208个视频序列和24个独特主体。数据集通过灵活的多视角捕捉系统和无标记算法进行创建,旨在解决现有方法在严重遮挡和近距离互动场景中的局限性。Harmony4D主要应用于虚拟现实系统中的人类互动建模,以提高模型的真实性和多样性。

Harmony4D is a large-scale multi-view video dataset developed by Carnegie Mellon University, focusing on close-range human interactions in the wild, such as wrestling, dancing, mixed martial arts (MMA) and other similar scenarios. This dataset contains 1.66 million images and 3.32 million visible human instances, captured by over 20 synchronized cameras, covering 208 video sequences and 24 unique subjects. Built with a flexible multi-view capture system and markerless algorithms, Harmony4D aims to address the limitations of existing methods in scenarios with severe occlusions and close-range human interactions. It is primarily applied to human interaction modeling in virtual reality systems, to enhance the authenticity and diversity of the models.
提供机构:
卡内基梅隆大学
创建时间:
2024-10-27
搜集汇总
数据集介绍
main_image_url
构建方式
Harmony4D数据集的构建采用了灵活的多视角捕捉系统,以记录包括摔跤、舞蹈、MMA等在内的动态活动。该系统通过20多个同步摄像头捕捉视频,并使用一种新颖的无标记算法来跟踪3D人体姿态,即使在严重遮挡和近距离交互的情况下也能实现。数据集的标注包括人体检测、跟踪、2D/3D姿态估计和网格恢复,这些标注通过最小化手动干预获得。
特点
Harmony4D数据集的显著特点在于其大规模和多样性。它包含了1.66百万张图像和3.32百万个人体实例,涵盖了24个独特的个体和多样化的环境。与以往的数据集不同,Harmony4D特别关注于自然环境中的动态活动和近距离交互,提供了丰富的标注信息,包括相机参数、2D边界框、人体跟踪身份、2D/3D人体姿态和3D人体网格。
使用方法
Harmony4D数据集适用于多种计算机视觉任务,特别是那些需要高精度3D人体姿态和网格恢复的应用。研究者可以利用该数据集进行算法评估和改进,特别是在处理复杂的人际交互和严重遮挡场景时。数据集的详细标注信息和多视角视频为开发和测试新的人体姿态估计和网格恢复算法提供了宝贵的资源。
背景与挑战
背景概述
在虚拟现实系统中,理解人类之间的互动是构建逼真多人体系统的关键。然而,由于缺乏大规模数据集,这一领域仍相对未被充分探索。现有的数据集主要集中在受控的室内环境中,且活动多为编排好的,这极大地限制了其多样性。为了解决这一问题,卡内基梅隆大学的研究人员引入了Harmony4D数据集,这是一个多视角视频数据集,专注于野外环境中的人际互动,如摔跤、舞蹈、综合格斗等。该数据集使用灵活的多视角捕捉系统记录这些动态活动,并提供人类检测、跟踪、2D/3D姿态估计和紧密互动对象的网格恢复的标注。Harmony4D数据集包含166万张图像和332万个实例,来自超过20个同步摄像头,涵盖208个视频序列,跨越多样化的环境和24个独特的受试者。
当前挑战
Harmony4D数据集面临的挑战主要集中在两个方面:一是解决领域问题,即在复杂和动态的野外环境中进行高精度的人类互动建模;二是数据集构建过程中遇到的挑战,如在严重遮挡和紧密互动场景中进行3D姿态跟踪和网格恢复。现有方法在处理频繁的人际接触时,由于严重的遮挡、截断和动态运动,往往难以恢复高质量的地面真实网格。此外,依赖于广泛静态捕捉系统的现有方法使得野外数据收集变得不切实际。因此,开发一种仅使用少量摄像头且能够准确提取野外环境中接触互动的3D地面真实数据的标记捕捉系统,是Harmony4D数据集面临的主要技术挑战。
常用场景
经典使用场景
Harmony4D数据集在研究人类近距离互动的场景中展现了其经典应用价值。该数据集通过多视角视频捕捉,提供了丰富的动态活动数据,如摔跤、舞蹈和综合格斗等,这些活动在自然环境中进行,而非受控的室内环境。研究者可以利用这些数据进行人体检测、跟踪、2D/3D姿态估计以及网格恢复等任务,从而深入分析和理解人类互动的复杂性。
解决学术问题
Harmony4D数据集解决了现有数据集在多样性和真实性方面的不足,特别是在处理人类近距离互动时的遮挡和动态运动问题。通过提供大规模、多样化的自然环境数据,该数据集显著提升了现有方法在复杂互动场景中的表现,推动了人体姿态和形状估计技术的发展,为学术界提供了新的研究方向和挑战。
衍生相关工作
Harmony4D数据集的发布激发了一系列相关研究工作。例如,基于该数据集的3D人体姿态估计和网格恢复算法得到了显著改进,特别是在处理遮挡和接触场景时。此外,研究者们还开发了新的多视角视频处理技术,以提高数据标注的准确性和效率。这些衍生工作不仅扩展了数据集的应用范围,也推动了计算机视觉领域的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作