five

IMHD$^2$|人机交互数据集|多视角分析数据集

收藏
github2024-05-09 更新2024-05-31 收录
人机交互
多视角分析
下载链接:
https://github.com/AfterJourney00/IMHD-Dataset
下载链接
链接失效反馈
资源简介:
IMHD$^2$ 是一个包含人类与物体交互的高动态多视角数据集,具有人类运动标注、物体运动标注、物体几何扫描、物体上安装的IMU传感器测量以及32视角的RGB视频和实例级分割等特点。

IMHD$^2$ is a high-dynamic multi-view dataset encompassing human-object interactions, featuring annotations of human motion, object motion, geometric scans of objects, IMU sensor measurements mounted on objects, as well as 32-view RGB videos and instance-level segmentation.
创建时间:
2023-12-21
原始信息汇总

数据集概述

数据集名称

IMHD$^2$: Inertial and Multi-view Highly Dynamic human-object interactions Dataset

数据集特点

数据集结构

data/ |--calibrations/ # 相机内参和世界到相机的外参 |--object_templates/ # 原始和下采样的几何数据 |--imu_preprocessed/ # 预处理后的IMU信号 |--keypoints2d/ # 身体关键点(OP25格式)和手部关键点(MediaPipe格式) |--keypoints3d/ # 身体关键点(OP25格式)和手部关键点(MediaPipe格式) |--ground_truth/ # 人类动作(SMPL-H格式)和刚体物体动作 |----<date>/ |------<segment_name>/ |--------<sequence_name>/ |----------gt_<part_id><start><end>.pkl

数据集使用指南

  1. 数据准备:从此处下载IMHD$^2$,并按照预定义的结构放置在根目录。
  2. 身体模型准备:参考body_model
  3. 运行示例:使用python visualization.py加载和可视化IMHD$^2$,结果将保存在visualizations/

常见问题解答

  • Q1: 地面实况动作的坐标是什么?如何对齐不同日期的所有动作?

    • A1: 地面实况动作在世界坐标中,使用多相机系统校准,可以使用提供的相机参数在calibrations/中转换所有动作数据到相机坐标。
  • Q2: 在20230825/20230827/中的动作与哪种物体类别交互?

    • A2: 交互物体类别是棒球棒,对应于object_templates/文件夹中的baseball
  • Q3: 哪个相机是主视图?

    • A3: 主视图来自标记为1的相机(从0开始)。
AI搜集汇总
数据集介绍
main_image_url
构建方式
IMHD$^2$数据集通过多模态数据采集与处理技术构建,涵盖了高动态的人类-物体交互场景。该数据集结合了惯性测量单元(IMU)传感器数据、多视角RGB视频、实例级分割以及3D人体关键点检测。具体而言,人体运动通过SMPL-H格式进行标注,基于EasyMocap工具;物体运动则通过PHOSA框架进行标注。此外,物体几何信息通过Polycam扫描获取,IMU数据则通过Movella DOT传感器采集。多视角视频和分割数据分别基于SAM、Track-Anything和XMem工具生成,而2D和3D人体关键点检测则使用了ViTPose和MediaPipe技术。
特点
IMHD$^2$数据集的显著特点在于其多模态数据的融合与高动态场景的捕捉。该数据集不仅提供了丰富的人体和物体运动标注,还包含了精确的物体几何信息和IMU传感器数据,为研究复杂的人类-物体交互提供了全面的视角。此外,数据集中的多视角视频和实例级分割为多视角分析提供了强大的支持,而3D人体关键点检测则为动作识别和姿态估计提供了高质量的基础数据。
使用方法
使用IMHD$^2$数据集时,首先需从指定链接下载数据,并按照预定义的目录结构进行组织。随后,用户需准备SMPL-H模型文件,并将其放置在指定的`body_model/`目录下。通过运行`python visualization.py`脚本,用户可以加载并可视化数据集中的内容,结果将保存在`visualizations/`目录中。此外,数据集提供了详细的相机校准参数,用户可根据需要将运动数据转换到不同的坐标系中进行分析。
背景与挑战
背景概述
IMHD$^2$(Inertial and Multi-view Highly Dynamic human-object interactions Dataset)是由Chengfeng Zhao等人于2024年创建的,旨在研究高动态人机交互的三维捕捉问题。该数据集的核心研究问题是如何通过惯性和多视角数据,精确捕捉和分析复杂的人机交互场景。IMHD$^2$不仅包含了32个视角的RGB视频和实例级分割,还集成了惯性测量单元(IMU)传感器数据,以及基于SMPL-H格式的人体运动和物体运动标注。该数据集的发布对计算机视觉领域,特别是人机交互和动作捕捉技术的研究具有重要意义,推动了相关领域的技术进步。
当前挑战
IMHD$^2$数据集在构建过程中面临多项挑战。首先,高动态人机交互场景的复杂性使得数据采集和标注变得极为困难,尤其是如何在多视角和惯性数据之间实现精确对齐。其次,数据集的构建涉及多种先进技术的集成,如SMPL-H模型、PHOSA算法、以及多视角视频处理技术,这些技术的融合与优化增加了数据集构建的复杂性。此外,数据集的规模和多样性要求高效的存储和处理方案,以确保数据的可用性和研究的可重复性。这些挑战不仅反映了数据集构建的技术难度,也凸显了其在推动相关领域研究中的重要性。
常用场景
经典使用场景
IMHD$^2$数据集在三维人体与物体交互(3D Human-Object Interaction, HOI)领域具有广泛的应用。其经典使用场景包括通过多视角视频和惯性测量单元(IMU)数据,捕捉和分析高度动态的人体与物体交互过程。该数据集提供了丰富的标注信息,如人体运动(SMPL-H格式)、物体运动(PHOSA格式)、32视角的2D和3D关键点检测等,这些数据为研究者提供了深入理解复杂交互行为的工具。
实际应用
IMHD$^2$数据集在实际应用中具有广泛的前景,特别是在虚拟现实(VR)、增强现实(AR)、运动分析和人机交互等领域。例如,在VR/AR应用中,该数据集可以用于实时捕捉和重建用户与虚拟物体的交互,提升沉浸感和交互体验。此外,在运动分析领域,IMHD$^2$可以用于运动员的动作捕捉和分析,帮助优化训练和表现。
衍生相关工作
IMHD$^2$数据集的发布催生了一系列相关研究工作,特别是在三维人体与物体交互的建模与分析方面。例如,基于该数据集的研究工作已经在计算机视觉顶级会议CVPR 2024上发表,展示了其在人体运动捕捉和物体交互分析中的应用。此外,该数据集还为开发新的深度学习模型和算法提供了丰富的实验数据,推动了相关领域的技术进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2024)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

ShapeNet

ShapeNet 是由斯坦福大学、普林斯顿大学和美国芝加哥丰田技术研究所的研究人员开发的大型 3D CAD 模型存储库。该存储库包含超过 3 亿个模型,其中 220,000 个模型被分类为使用 WordNet 上位词-下位词关系排列的 3,135 个类。 ShapeNet Parts 子集包含 31,693 个网格,分为 16 个常见对象类(即桌子、椅子、平面等)。每个形状基本事实包含 2-5 个部分(总共 50 个部分类)。

OpenDataLab 收录

Tunnel Crack Detection Thermal And Visible Dataset (CrackTAV)

一个用于隧道裂缝检测的多模态数据集,包含多种通道配置,包括RGB、IR、融合的RGB-IR、RGB-T和RGB-IR模态。

github 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录