IKEA ASM Dataset

github2024-04-25 更新2024-05-31 收录

下载链接：

https://github.com/IkeaASM/IKEA_ASM_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含三百万帧的多视角家具组装视频数据集，包括深度、原子动作、对象分割和人体姿态。该数据集用于丰富分析和理解人类活动，并支持视频动作识别、对象分割和人体姿态估计等任务的开发。

This is a multi-view furniture assembly video dataset comprising three million frames, including depth, atomic actions, object segmentation, and human poses. The dataset is designed to enrich the analysis and understanding of human activities, supporting the development of tasks such as video action recognition, object segmentation, and human pose estimation.

创建时间：

2020-09-25

原始信息汇总

数据集概述

名称: IKEA ASM Dataset
描述: 该数据集包含三百万帧的多视角家具组装视频，包括深度信息、原子动作、物体分割和人体姿态。数据集旨在支持深度学习方法在视频动作识别、物体分割和人体姿态估计等任务中的应用。

数据集内容

视频: 多视角家具组装视频，总大小约240GB。
数据类型: 包括RGB视频、深度信息、原子动作、物体分割和人体姿态。
数据分割: 视频数据可按需下载，包括RGB单视角、RGB多视角、深度数据等。
标注: 提供动作、姿态、分割和跟踪的标注数据。
预训练模型: 提供动作、姿态、分割和跟踪的预训练模型。

数据集用途

动作识别: 用于训练和测试视频中的动作识别模型。
姿态估计: 用于训练和测试人体姿态估计模型。
物体分割和跟踪: 用于训练和测试物体分割和跟踪模型。

引用信息

论文: Ben-Shabat, Yizhak et al. "The IKEA ASM Dataset: Understanding People Assembling Furniture through Actions, Objects and Pose." arXiv preprint arXiv:2007.00394 (2020).
会议: Ben-Shabat, Yizhak et al. "The IKEA ASM Dataset: Understanding People Assembling Furniture through Actions, Objects and Pose." Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (2021): 847-859.

数据集下载

全数据集下载: 链接
部分数据下载: 包括实用文件、相机参数、数据（RGB单视角、RGB多视角、深度）、标注（动作、姿态、分割和跟踪）、预训练模型（动作、姿态、分割和跟踪）。

使用指南

数据处理: 使用提供的工具脚本提取视频帧。
依赖: 查看requirements.txt获取依赖信息。
基准测试: 提供动作识别、姿态估计、物体分割和跟踪的基准测试，详细信息请参考各个基准目录下的README.md文件。

搜集汇总

数据集介绍

构建方式

IKEA ASM数据集通过多视角、多模态的方式构建，涵盖了三百万帧的家具组装视频数据。该数据集不仅包括RGB视频，还提供了深度信息、原子动作标注、对象分割以及人体姿态数据。数据集的构建旨在通过多视角和多模态数据的整合，支持对人类活动进行更丰富的分析和理解。

特点

IKEA ASM数据集的显著特点在于其多视角和多模态的数据结构，包括RGB视频、深度信息、动作标注、对象分割和人体姿态。这些丰富的数据类型使得该数据集在视频动作识别、对象分割和人体姿态估计等任务中具有极高的应用价值。此外，数据集还提供了预训练模型，便于研究者快速进行实验和验证。

使用方法

使用IKEA ASM数据集时，用户首先需通过提供的链接下载数据集，并使用工具箱中的脚本提取视频帧。数据集支持多种基准测试，包括动作识别、姿态估计、部分分割和跟踪。用户可根据具体需求选择相应的预训练模型，并参考各基准测试目录下的README文件进行训练、测试和评估。

背景与挑战

背景概述

IKEA ASM数据集是由Yizhak Ben-Shabat等人于2020年创建，旨在推动计算机视觉领域中对人类活动理解的深入研究。该数据集包含三百万帧的多视角视频，涵盖了深度信息、原子动作、物体分割以及人体姿态等多维度数据，特别聚焦于家具组装过程中的复杂行为分析。通过提供多模态和多视角的数据，IKEA ASM数据集为视频动作识别、物体分割和人体姿态估计等任务提供了丰富的资源，推动了相关领域研究的发展，并在2021年WACV会议上进行了展示。

当前挑战

IKEA ASM数据集的构建面临多重挑战。首先，数据集的规模庞大，包含三百万帧的多视角视频，处理和存储这些数据需要高效的计算资源和存储解决方案。其次，数据集的多模态特性，包括深度信息、动作标注、物体分割和人体姿态，要求在数据采集和标注过程中保持高度的准确性和一致性。此外，家具组装过程中的复杂动作和多变的环境增加了数据标注的难度。最后，如何有效整合多视角和多模态数据，以提升动作识别、物体分割和姿态估计的性能，是该数据集在实际应用中面临的重要挑战。

常用场景

经典使用场景

IKEA ASM数据集在计算机视觉领域中，主要用于多视角、多模态的人类活动分析。该数据集通过提供包含深度信息、原子动作、物体分割以及人体姿态的多视角视频数据，为研究者提供了丰富的资源，以开发和评估视频动作识别、物体分割和人体姿态估计等任务的算法。其经典使用场景包括但不限于：基于多视角视频的动作识别，通过整合多模态数据提升动作识别的准确性；以及在复杂场景中进行人体姿态估计，利用深度信息和多视角数据提高姿态估计的精度。

实际应用

在实际应用中，IKEA ASM数据集可以用于智能家居系统中的家具组装辅助，通过识别用户的动作和姿态，提供实时的指导和反馈。此外，该数据集还可应用于工业自动化领域，如机器人辅助装配线，通过精确的动作识别和姿态估计，提高机器人操作的效率和安全性。在医疗康复领域，该数据集也可用于开发个性化的康复训练系统，通过分析患者的动作和姿态，提供定制化的康复方案。

衍生相关工作

基于IKEA ASM数据集，研究者们开发了多种多视角、多模态数据融合的方法，显著提升了视频动作识别、物体分割和人体姿态估计的性能。例如，有研究利用该数据集进行多视角动作识别，通过融合不同视角的信息，提高了动作识别的准确率。此外，还有研究基于该数据集开发了新的物体分割算法，通过结合深度信息和多视角数据，实现了更精确的物体分割。这些衍生工作不仅丰富了计算机视觉领域的研究内容，也为实际应用提供了技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集