MOD20

Name: MOD20
Creator: Defence Science and Technology Group
Published: 2021-10-07 22:50:43
License: 暂无描述

arXiv2021-10-07 更新2024-06-21 收录

下载链接：

https://asankagp.github.io/mod20/

下载链接

链接失效反馈

官方服务：

资源简介：

MOD20数据集是由Defence Science and Technology Group创建的，专注于户外多视角人体动作识别。该数据集包含2324个视频片段，总计503086帧，覆盖20种动态人体动作类别。数据来源于YouTube和自主无人机拍摄，视频分辨率为720×720，确保原始比例不变。创建过程涉及从多个视角收集视频，并进行精细的标注工作。MOD20数据集适用于动作识别、监控和态势感知等研究领域，旨在解决户外复杂环境中的人体动作识别问题。

The MOD20 dataset was developed by the Defence Science and Technology Group, focusing on multi-view human action recognition in outdoor environments. This dataset comprises 2,324 video clips, amounting to a total of 503,086 frames, and encompasses 20 categories of dynamic human actions. The data is sourced from YouTube and footage captured by autonomous drones, with a resolution of 720×720 to preserve the original aspect ratio. The dataset curation process involved collecting videos from multiple perspectives and conducting meticulous annotation work. The MOD20 dataset is applicable to research fields including action recognition, surveillance, and situation awareness, and aims to address the challenges of human action recognition in complex outdoor environments.

提供机构：

Defence Science and Technology Group

创建时间：

2021-10-07

搜集汇总

数据集介绍

构建方式

MOD20数据集的构建方式体现了多视角和真实场景的考虑。数据集由来自YouTube和研究人员自己的无人机拍摄的2324个视频片段组成，涵盖了20种动态人类动作类别。视频片段被裁剪并调整到720x720像素，保持了原始的人体比例。数据收集过程中，优先考虑了空中视角，并对动作的视角分布进行了离散化，确保了视角的多样性。数据集的标注包括动作类别、视角和参与人数，为研究提供了丰富的信息。

特点

MOD20数据集具有以下特点：首先，它是一个多视角数据集，包含了地面和空中的视角，这对于研究户外人类动作识别具有重要意义。其次，数据集涵盖了20种常见的户外动作，如冲浪、滑雪等，具有较强的现实意义。此外，数据集还包含了单人和多人动作的视频片段，进一步增加了其复杂性。最后，数据集的视频片段均被裁剪并调整到统一的分辨率，方便了模型的输入。

使用方法

MOD20数据集的使用方法如下：首先，将数据集下载到本地，并解压。然后，使用提供的标注信息进行数据预处理，如裁剪、缩放等。接下来，根据研究需求选择合适的模型，如两流CNN架构，并结合核化排名池化方法进行特征提取。最后，使用训练好的模型进行动作识别，并评估其准确率。

背景与挑战

背景概述

MOD20数据集是一个多视角户外动作识别数据集，由Asanka G.Perera等人在2021年创建。该数据集旨在填补现有数据集中多视角动作识别数据稀缺的空白，并推动户外动作识别、监控和态势感知等研究领域的进展。MOD20数据集包含20个动态人类动作类别、2324个视频片段和503086个帧。所有视频都被裁剪并调整大小为720×720像素，以保持视频中人类主体的原始宽高比。该数据集对于动作识别、监控和态势感知等研究领域具有重要意义。

当前挑战

MOD20数据集在解决多视角动作识别领域问题方面面临着以下挑战：1) 从多个视角，尤其是从空中视角，检测动作具有挑战性，因为人体具有复杂的多关节结构；2) 缺乏覆盖多个视角的动作数据集，使得研究多视角动作识别变得困难。在构建过程中，MOD20数据集也遇到了以下挑战：1) 收集涵盖多个视角的动作数据需要大量的时间和资源；2) 对视频进行标注需要人工干预，这增加了构建数据集的成本和复杂性。

常用场景

经典使用场景

MOD20数据集作为多视角户外动作识别领域的重要资源，其经典使用场景在于为动作识别算法提供训练和测试数据。通过该数据集，研究者可以训练深度学习模型，学习不同视角下人类动作的特征，从而提高模型在真实场景中的识别准确率。此外，MOD20数据集也常用于评估动作识别算法的性能，为算法的改进提供参考。

衍生相关工作

基于MOD20数据集，研究者开展了一系列相关研究，取得了丰硕的成果。例如，研究者利用MOD20数据集评估了多种动作识别算法的性能，并提出了改进算法，提高了动作识别的准确率。此外，研究者还利用MOD20数据集研究了多视角动作识别的挑战和解决方案，为该领域的研究提供了重要的参考。

数据集最近研究