3DHOI-Dataset

github2024-05-07 更新2024-05-31 收录

下载链接：

https://github.com/wenboran2002/3DHOI-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集专注于将自定义的3D HOI数据集转换为特定格式，包括对象、人类表示、交互和集成格式的详细处理方法。数据集使用BEHAVE作为示例，展示了如何从自定义数据集中提取和转换数据以符合3D HOI格式。

This dataset focuses on converting custom 3D HOI datasets into a specific format, including detailed processing methods for objects, human representations, interactions, and integration formats. Using BEHAVE as an example, the dataset demonstrates how to extract and transform data from custom datasets to conform to the 3D HOI format.

创建时间：

2024-05-05

原始信息汇总

3DHOI-Dataset 概述

数据集格式

对象（Object）

每个对象包含4096个点。
对于自定义数据集，需从帧中提取对象并随机选择4096个点。
接触标签为二进制形式，仅保留与人体有直接接触的对象。对于BEHAVE数据集，接触阈值设为50个点。

人体（Human）

使用SMPL-X参数表示每个人。
若自定义数据集提供其他模型，需转换为SMPL-X格式。
需要的SMPL-X参数包括：body_pose, lhand_pose, shape, root_pose, rhand_pose, jaw_pose, exp, cam_trans。
接触区域使用身体部位标签。

交互（Interaction）

若自定义数据集未提供交互标签，需使用rgba图像生成。
使用Llava从四个视角的图像中分析并整合动词。
提供了一系列可能的动词，其他数据集可根据需要替换。

数据集结构

每个图像ID包含以下内容：
- 图像文件（如.png,.jpg）
- smplx_parameters.json
- obj_pcd_0.ply
- 接触标签：
  - human_part.json
  - obj_contact.json
- annotations.json

注释生成

生成注释需要人体边界框、对象边界框和动作。
注释格式遵循hico-det格式，略有改动。
示例注释包括文件名、hoi_annotation、annotations等字段，其中hoi_annotation描述了主体和对象的ID及动作。

搜集汇总

数据集介绍

构建方式

3DHOI-Dataset的构建方式主要通过将自定义的3D人体-物体交互数据集转换为统一的格式。具体而言，该数据集以BEHAVE数据集为例，提取每帧中的物体，并随机选择4096个点作为物体的表示。对于人体部分，采用SMPL-X参数模型来表示，确保所有人体模型统一为SMPL-X格式。此外，数据集还通过计算物体表面点与人体模型之间的距离，生成二元接触标签，以识别直接接触的点。最后，通过Llava模型从RGBA图像中提取交互动作标签，并整合为统一的标注格式。

特点

3DHOI-Dataset的主要特点在于其高度结构化的数据表示和丰富的交互信息。数据集中的每个物体包含4096个点，确保了物体的精细表示。人体部分采用SMPL-X参数模型，提供了详细的身体姿态和形状信息。此外，数据集通过二元接触标签和动作标签，详细记录了人体与物体之间的交互细节，使得该数据集在研究3D人体-物体交互任务中具有较高的实用性和准确性。

使用方法

使用3DHOI-Dataset时，用户可以通过提供的代码将自定义数据集转换为该数据集的格式。首先，用户需要提取物体和人体的表示，并将其转换为SMPL-X格式。接着，通过计算物体表面点与人体模型之间的距离，生成接触标签。最后，用户可以使用Llava模型从RGBA图像中提取交互动作标签，并整合为统一的标注格式。数据集的最终格式包括图像、SMPL-X参数、物体点云、接触标签和交互动作标签，用户可以根据需求进行进一步的分析和应用。

背景与挑战

背景概述

3DHOI-Dataset是由研究人员开发的一个专注于三维人体-物体交互（3D Human-Object Interaction, 3DHOI）的数据集。该数据集的核心研究问题是如何在三维空间中准确捕捉和表示人体与物体之间的交互行为。通过使用SMPL-X参数模型来表示人体，并结合点云数据来描述物体，3DHOI-Dataset为研究者提供了一个标准化的数据格式，以便于对复杂的人体-物体交互进行建模和分析。该数据集的创建旨在推动计算机视觉和机器人学领域的发展，特别是在理解和模拟人类与环境交互方面。

当前挑战

3DHOI-Dataset在构建过程中面临多项挑战。首先，如何从自定义数据集中提取并标准化物体和人体的表示，特别是将不同模型转换为SMPL-X格式，是一项技术难题。其次，确定人体与物体之间的接触点并生成二元接触标签，需要精确的计算和阈值设定。此外，生成交互标签时，如何从RGBA图像中提取准确的动词描述，并确保这些描述与实际交互行为一致，也是一个重要的挑战。最后，数据集的整合和标注格式化，特别是与现有数据集（如HICO-DET）的兼容性，增加了数据处理的复杂性。

常用场景

经典使用场景

3DHOI-Dataset在三维人体-物体交互（3D Human-Object Interaction, 3DHOI）研究中具有经典应用场景。该数据集通过整合人体和物体的三维点云数据，结合SMPL-X参数模型，提供了详细的人体姿态和物体接触信息。研究者可以利用该数据集进行人体与物体交互的深度学习模型训练，特别是在识别和分类不同交互动作方面，如抓取、坐下、推动等。此外，数据集还支持从自定义数据集中提取和转换为3DHOI格式，增强了其在不同应用场景中的灵活性和适用性。

解决学术问题

3DHOI-Dataset解决了三维空间中人体与物体交互的复杂建模问题。传统二维图像数据集难以捕捉三维空间中的交互细节，而该数据集通过提供精确的三维点云和SMPL-X参数，使得研究者能够更准确地理解和建模人体与物体的交互行为。这不仅推动了计算机视觉领域在三维交互理解方面的研究进展，还为行为识别、动作预测等学术问题提供了新的解决方案。

衍生相关工作

基于3DHOI-Dataset，研究者们开发了多种相关的经典工作。例如，有研究利用该数据集进行三维人体姿态估计和物体接触点检测，进一步提升了交互模型的精度。此外，还有工作通过结合深度学习技术，提出了新的交互动作分类方法，显著提高了动作识别的准确率。这些衍生工作不仅丰富了3DHOI领域的研究内容，还为相关领域的技术应用提供了坚实的基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集