NTURGB+D/NTURGB+D 120

github2024-05-15 更新2024-05-31 收录

下载链接：

https://github.com/liujf69/Data-Processing

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含NTURGB+D和NTURGB+D 120两个部分，用于多模态数据处理和可视化，支持视频、音频和3D数据处理。

This dataset comprises two components, NTURGB+D and NTURGB+D 120, designed for multimodal data processing and visualization, supporting video, audio, and 3D data handling.

创建时间：

2023-06-20

原始信息汇总

数据集概述

数据集名称

NTURGB+D/NTURGB+D 120

数据集下载

下载位置：Download_Dataset 文件夹

数据处理与可视化工具

视频处理

Extract_NTU_Person 文件夹：用于处理 NTURGB+D/NTURGB+D 120 视频。

音频处理

Audio_Parser 文件夹：用于简单处理音频。

FBX数据处理与可视化

FBX_SDK_Maya 文件夹：用于在 Maya 中提取和可视化 fbx 数据。
SkExtract_FromFBX 文件夹：使用 FBX SDK 提取 fbx 数据。

姿态估计

SimCC_Pose 文件夹：使用 YoloV5 和 SimCC 进行姿态估计。

UAV_Human 数据集处理

UAV_Human 文件夹：用于处理 UAV_Human 数据集的骨骼。

可视化工具

VisNTU_WithBlender 文件夹：在 Blender 中可视化 NTURGBD 数据集的骨骼数据。
Vis_15jointToMANO 文件夹：在 MANO 类型中可视化手势数据。
Vis_22JointToSMPL 文件夹：在 SMPL 类型中可视化身体数据。

视频中人物检测

Yolo_det_video 文件夹：使用 YoloV5 模型从视频中检测人物。

搜集汇总

数据集介绍

构建方式

NTURGB+D 120数据集的构建基于多模态数据的采集与处理，涵盖了RGB视频、深度图像、骨骼数据等多种信息源。通过使用高精度的传感器设备，数据集捕捉了人体动作的详细信息，并结合多种处理工具对原始数据进行提取和标注。具体而言，数据集的构建过程包括视频数据的下载与处理、音频数据的解析、骨骼数据的提取与可视化等步骤，确保了数据的多维度性和高质量。

使用方法

NTURGB+D 120数据集的使用方法多样，适用于多种计算机视觉和机器学习任务。用户可以通过提供的工具链对数据进行处理，如使用YoloV5进行人体检测、SimCC进行姿态估计、FBX SDK提取骨骼数据等。此外，数据集还支持在Blender、Maya等软件中进行可视化操作，便于研究人员直观地分析和理解数据。用户可根据具体需求选择合适的工具和方法，进行数据处理和模型训练。

背景与挑战

背景概述

NTURGB+D 120数据集是由新加坡国立大学（NUS）的研究团队创建的，专注于多模态人体动作识别领域。该数据集于近年发布，旨在为研究人员提供一个大规模、多样化的数据资源，以推动动作识别技术的发展。NTURGB+D 120不仅包含了RGB视频和深度信息，还涵盖了骨骼数据、音频等多模态信息，极大地丰富了动作识别的研究维度。该数据集的发布对计算机视觉、人机交互以及智能监控等领域产生了深远的影响，成为相关研究的重要基石。

当前挑战

NTURGB+D 120数据集在构建过程中面临了多重挑战。首先，多模态数据的融合与处理是一个复杂的问题，如何有效整合RGB、深度、骨骼和音频数据，以提升动作识别的准确性，是研究中的一个关键挑战。其次，数据集的规模庞大，处理和存储这些数据需要高效的算法和强大的计算资源。此外，数据集的多样性和复杂性也带来了标注和一致性问题，确保数据质量成为构建过程中的另一大挑战。

常用场景

经典使用场景

NTURGB+D 120数据集在动作识别领域中具有广泛的应用，尤其是在多模态数据处理与分析方面。该数据集结合了RGB视频、深度信息、骨骼数据和音频等多模态数据，为研究人员提供了丰富的资源，用于开发和验证动作识别算法。经典的使用场景包括基于骨骼的动作识别、多模态融合的动作分类以及复杂场景下的动作检测。通过这些应用，研究人员能够深入探索人体动作的本质特征，从而提升动作识别的准确性和鲁棒性。

解决学术问题

NTURGB+D 120数据集为解决动作识别领域的多个学术问题提供了重要支持。首先，它通过提供多模态数据，解决了单一模态数据在复杂场景下识别精度不足的问题。其次，该数据集的高质量标注和多样化的动作类别，为研究者提供了丰富的实验数据，推动了动作识别模型的优化与创新。此外，NTURGB+D 120还为多模态数据融合、跨模态学习等前沿研究提供了实验平台，促进了相关领域的发展。

实际应用

NTURGB+D 120数据集在实际应用中展现了巨大的潜力。在智能监控领域，该数据集的多模态数据可以用于开发高精度的动作识别系统，提升公共场所的安全性。在医疗康复领域，通过分析患者的动作数据，可以为康复训练提供个性化指导。此外，在虚拟现实和人机交互领域，NTURGB+D 120数据集的多模态信息为开发更加自然和智能的交互系统提供了数据支持，推动了相关技术的实际应用。

数据集最近研究