EgoBody3M
收藏github2024-07-26 更新2024-07-27 收录
下载链接:
https://github.com/facebookresearch/EgoBody3M
下载链接
链接失效反馈官方服务:
资源简介:
EgoBody3M是一个大规模的真实图像数据集,用于头部佩戴VR设备的自我中心身体追踪。该数据集包含超过30小时的录制和300万帧图像,具有真实的VR头盔配置和多样化的受试者及动作。
EgoBody3M is a large-scale real-world image dataset dedicated to egocentric body tracking with head-mounted VR devices. This dataset encompasses over 30 hours of recordings and 3 million image frames, with authentic VR headset configurations and diverse subjects and actions.
创建时间:
2024-07-24
原始信息汇总
EgoBody3M 数据集概述
数据集简介
EgoBody3M 是一个用于第一人称视角身体跟踪的大规模真实图像数据集,适用于虚拟现实(VR)、增强现实(AR)或混合现实(MR)设备。该数据集包含超过30小时的录制内容和300万帧图像,旨在支持无控制器的身体跟踪解决方案的研究和开发。
数据集格式
数据集由一系列.zip文件组成,每个序列对应一个唯一的数字ID。图像文件和元数据文件分别存储在不同的.zip文件中。
文件结构
123456789.images.zip:包含图像文件。123456789.metadata.zip:包含元数据文件。
解压后,每个文件夹包含以下内容:
- 图像文件:例如
123456789/frame0000_cam0.jpg。 - 元数据文件:例如
123456789/frame0000.json。
元数据格式
元数据存储在JSON文件中,包含以下关键信息:
frame_index:帧索引。world_from_headset_xf_cm:从世界空间到头显局部空间的变换,单位为厘米。joint_positions_world_cm:26个跟踪关节在世界空间中的位置。projected_joint_positions_cam0_px:关节在第一/第二/第n个相机中的投影位置。
身体关节
数据集使用26个身体关节,具体信息如下:
| 索引 | 关节名称 | 身体部位 |
|---|---|---|
| 0 | b_head | 颅底 |
| 1 | b_l_shoulder | 肩胛骨 |
| 2 | b_l_arm | 肩关节 |
| 3 | b_l_forearm | 肘关节 |
| 4 | b_l_wrist | 腕关节 |
| 5 | b_r_shoulder | 肩胛骨 |
| 6 | b_r_arm | 肩关节 |
| 7 | b_r_forearm | 肘关节 |
| 8 | b_r_wrist | 腕关节 |
| 9 | b_neck0 | 颈椎 |
| 10 | b_spine0 | 骶骨 |
| 11 | b_spine1 | 腰椎顶端 |
| 12 | b_spine2 | 胸椎中部 |
| 13 | b_spine3 | 胸椎顶端 |
| 14 | b_r_upleg | 髋关节 |
| 15 | b_r_leg | 膝关节 |
| 16 | b_r_foot_twist | 踝关节 |
| 17 | b_r_talocrural | 踝关节 |
| 18 | b_r_subtalar | 脚跟 |
| 19 | b_r_transversetarsal | 中足 |
| 20 | b_l_upleg | 髋关节 |
| 21 | b_l_leg | 膝关节 |
| 22 | b_l_foot_twist | 踝关节 |
| 23 | b_l_talocrural | 踝关节 |
| 24 | b_l_subtalar | 脚跟 |
| 25 | b_l_transversetarsal | 中足 |
搜集汇总
数据集介绍

构建方式
EgoBody3M数据集的构建基于实际VR设备上的无控制器自中心身体跟踪解决方案。该数据集通过使用与SLAM跟踪相同的摄像头,捕捉了超过30小时的真实图像记录,共计300万帧。数据集包括多个序列,每个序列具有唯一的数字ID,并分为图像和元数据两部分。图像部分存储在以序列ID命名的.zip文件中,而元数据则存储在相应的.metadata.zip文件中。每个文件解压后形成一个包含图像和元数据文件的文件夹,确保了数据的高效组织和访问。
特点
EgoBody3M数据集的显著特点在于其大规模、多样性和真实性。首先,数据集包含超过30小时的视频记录,涵盖了300万帧图像,为研究提供了丰富的数据资源。其次,数据集采用了真实的VR头戴设备配置,确保了数据的实际应用价值。此外,数据集包含了多样化的受试者和动作,增强了其在不同场景下的适用性。最后,数据集的元数据详细记录了头部跟踪和身体关节位置等信息,为研究提供了全面的支持。
使用方法
EgoBody3M数据集的使用方法相对直接。首先,用户需要下载并解压相应的.zip文件,获取图像和元数据。图像文件以帧编号和摄像头编号命名,便于索引和处理。元数据文件以JSON格式存储,包含了帧索引、头部跟踪变换、关节位置等信息。用户可以通过解析JSON文件,获取所需的数据进行进一步分析和处理。数据集的结构设计使得用户可以轻松地进行数据提取和应用,适用于多种VR/AR领域的研究需求。
背景与挑战
背景概述
EgoBody3M数据集是由Amy Zhao、Chengcheng Tang等研究人员在ECCV 2024会议上发布的一个大型真实图像数据集,专注于虚拟现实(VR)头戴设备上的自我中心身体追踪。该数据集的创建旨在解决现有VR/AR设备中身体追踪方法的局限性,这些方法要么依赖于不充分的约束条件,如仅从头戴设备和控制器的位置推断全身姿态,要么需要不切实际的硬件设置,这些设置将摄像头放置在远离用户面部的位置以提高身体可见性。EgoBody3M数据集通过提供一个无控制器的自我中心身体追踪解决方案,利用用于SLAM追踪的相同摄像头,为VR设备上的身体追踪提供了新的可能性。该数据集包含超过30小时的录制和300万帧图像,涵盖了多样化的主体和动作,为研究人员提供了一个强大的基准,以评估和改进身体追踪技术。
当前挑战
EgoBody3M数据集在构建过程中面临了多个挑战。首先,如何在无控制器的情况下,仅依赖头戴设备上的摄像头实现高精度的身体追踪是一个技术难题。其次,数据集的多样性和规模要求在录制过程中确保图像质量和动作捕捉的准确性,这需要复杂的硬件和软件支持。此外,数据集的发布和维护也面临挑战,如确保数据的安全性和隐私保护,以及持续更新和扩展数据集以适应不断发展的技术需求。这些挑战不仅推动了数据集的技术创新,也为未来的研究提供了丰富的探索空间。
常用场景
经典使用场景
在虚拟现实(VR)、增强现实(AR)和混合现实(MR)领域,EgoBody3M数据集的经典使用场景主要集中在用户身体姿态的精确追踪。通过该数据集,研究人员和开发者能够训练和验证基于多视角特征的时序身体运动模型,从而实现无需控制器的自适应身体追踪。这种追踪技术不仅提升了用户体验的自然度和真实感,还为开发更直观的用户界面提供了坚实的基础。
解决学术问题
EgoBody3M数据集解决了现有VR/AR设备上身体追踪方法的两大主要问题:一是现有方法通常依赖于不充分的约束条件,如仅通过头戴设备和控制器的位置来推断全身姿态;二是这些方法需要复杂的硬件设置,通常需要将摄像头放置在远离用户面部的位置以提高身体可见性。EgoBody3M通过提供大规模的真实图像数据集,推动了无需额外硬件的自我中心身体追踪技术的发展,显著提升了追踪的准确性和流畅性。
衍生相关工作
EgoBody3M数据集的发布激发了大量相关研究工作。例如,基于该数据集的深度学习模型被广泛应用于身体姿态估计和动作识别任务中,推动了计算机视觉和机器学习领域的发展。此外,该数据集还促进了多视角特征融合和时序数据处理技术的研究,为未来的VR/AR技术提供了新的研究方向和方法论。
以上内容由遇见数据集搜集并总结生成



