IMHD-Dataset
收藏IMHD²: Inertial and Multi-view Highly Dynamic human-object interactions Dataset 概述
数据集简介
IMHD² 是一个专注于高动态人机交互(Human-Object Interactions, HOI)的数据集,全称为“Inertial and Multi-view Highly Dynamic human-object interactions Dataset”。该数据集旨在支持惯性感知的单目3D人机交互捕捉研究。
数据集特征
- 人体运动标注:采用 SMPL-H 格式,基于 EasyMocap 构建。
- 物体运动标注:基于 PHOSA 构建。
- 物体几何模型:使用 Polycam 进行高质量扫描。
- 惯性测量单元(IMU)数据:通过 Movella DOT 传感器采集,安装在物体上。
- 多视角RGB视频:包含32个视角的原始视频。
- 实例级分割:基于 SAM、Track-Anything 和 XMem 生成,提供人与物体的分离掩码。
- 2D与3D人体关键点检测:使用 ViTPose 和 MediaPipe 提供身体(OP25格式)和手部关键点。
数据集结构
数据集根目录为 data/,包含以下子目录:
calibrations/:相机内参和世界到相机的变换矩阵。object_templates/:原始及下采样后的物体几何模型。imu_preprocessed/:预处理后的IMU信号。keypoints2d/:2D人体关键点(OP25格式)和手部关键点(MediaPipe格式)。keypoints3d/:3D人体关键点(OP25格式)和手部关键点(MediaPipe格式)。video_release/:32个多视角的原始视频。mask_release/:32个多视角下人与物体的分离分割掩码。ground_truth/:SMPL-H格式的人体运动标注和刚体物体运动标注。
标注文件按 <date>/<segment_name>/<sequence_name>/ 层级组织。部分序列的标注可能被分割为多个 .pkl 文件,文件名示例:gt_0_10_100.pkl 表示第一个运动片段,起始于第10帧,结束于第100帧。
使用方式
具体使用方法请参考官方 GitHub 仓库:https://github.com/AfterJourney00/IMHD-Dataset。
引用
如果使用本数据集或相关论文,请引用: bibtex @inproceedings{zhao2024imhoi, title={Im hoi: Inertia-aware monocular capture of 3d human-object interactions}, author={Zhao, Chengfeng and Zhang, Juze and Du, Jiashen and Shan, Ziwei and Wang, Junye and Yu, Jingyi and Wang, Jingya and Xu, Lan}, booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition}, pages={729--741}, year={2024} }
许可协议
本数据集采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。 许可协议链接:http://creativecommons.org/licenses/by-nc-sa/4.0/。




