myAVA

github2024-08-17 更新2024-08-19 收录

下载链接：

https://github.com/Shu-Ang/myAVA

下载链接

链接失效反馈

官方服务：

资源简介：

myAVA数据集包含视频帧和标注文件，用于训练和验证slowfast模型。数据集包括训练和验证的CSV文件、动作列表、排除的时间戳、密集提案文件等。数据集的准备涉及视频上传、裁剪、抽帧、标注和对象跟踪等步骤。

The myAVA dataset comprises video frames and annotation files, designed for training and validating the SlowFast model. It includes CSV files for training and validation, action lists, excluded timestamps, dense proposal files, and other related assets. The dataset preparation process involves steps such as video uploading, clipping, frame extraction, annotation, and object tracking.

创建时间：

2024-08-09

原始信息汇总

数据集概述

数据集文件结构

Dataset
- annotations
  - train.csv
  - val.csv
  - actionlist.pbtxt
  - train_excluded_timestamps.csv
  - val_excluded_timestamps.csv
  - dense_proposals_train.pkl
  - dense_proposals_val.pkl
- rawframes
  - video_0
    - frame_0

数据集视频准备

将视频上传至./Dataset/videos目录下，可以对多个视频进行处理。

数据集处理流程

视频裁剪、抽帧及检测
- 使用yolov5进行检测。
- 将./Dataset/choose_frames.zip下载到本地并解压，用于下一步标注操作。
使用via标注
- 下载via工具并进行标注。
- 导入图片，打开标注文件（注意，打开x_x_proposal_s.json），最后结果导出为videoname_finish.json，上传到服务器对应目录下./Dataset/choose_frames/videoname/。
使用deepsort跟踪对象并生成数据集
- 执行bash step2.sh，在./Dataset/annotations/目录下生成train.csv、val.csv、dense_proposals_train.pkl、dense_proposals_val.pkl。
- .csv文件结构如下：
  
  videoID sec x1 y1 x2 y2 actionID personID

数据集训练与测试

配置文件
- 配置文件内容包括模型设置、数据集路径、训练和测试的pipeline等。
开始训练
- 使用python tools/train.py命令进行训练。

搜集汇总

数据集介绍

构建方式

myAVA数据集的构建过程首先涉及视频的裁剪与抽帧，通过使用yolov5进行目标检测，筛选出关键帧。随后，利用via工具对这些关键帧进行详细标注，生成包含动作、位置和时间戳的标注文件。最终，通过脚本将标注信息整合，生成训练和验证所需的CSV文件及pkl文件，确保数据集的结构化和标准化。

特点

myAVA数据集的显著特点在于其精细的标注过程和高度的结构化。数据集不仅包含了视频帧的原始图像，还提供了详细的动作标注和时间戳信息，适用于复杂场景下的动作识别任务。此外，数据集支持多种预处理操作，如水平翻转和数据增广，增强了模型的泛化能力。

使用方法

使用myAVA数据集时，首先需配置相应的环境，包括安装Pytorch、ffmpeg等必要工具。接着，根据需求选择合适的训练框架，如mmaction2或SlowFast，并配置相应的配置文件。通过执行训练脚本，可以利用该数据集进行模型训练和验证，以实现高效的动作识别。

背景与挑战

背景概述

myAVA数据集是由Shu-Ang等研究人员创建的，专注于视频动作识别领域。该数据集的核心研究问题是如何在复杂场景中准确识别和分类人类行为。通过提供详细的视频帧和相应的标注信息，myAVA旨在推动视频分析技术的发展，特别是在动作识别和行为理解方面。该数据集的创建不仅为研究人员提供了一个标准化的测试平台，还促进了相关领域算法和模型的改进与创新。

当前挑战

myAVA数据集在构建过程中面临多重挑战。首先，视频数据的处理和标注需要大量的人力和时间，尤其是在确保标注的准确性和一致性方面。其次，数据集的多样性和复杂性增加了模型训练的难度，要求算法具备高度的鲁棒性和泛化能力。此外，视频帧的提取和处理过程中可能引入的噪声和失真，也对数据集的质量和后续分析提出了挑战。最后，如何在有限的计算资源下高效地处理和分析大规模视频数据，是该数据集面临的另一重要问题。

常用场景

经典使用场景

在视频分析领域，myAVA数据集的经典使用场景主要集中在动作识别和行为分析上。通过该数据集，研究者可以训练和验证模型在复杂场景中识别和分类不同人类动作的能力。例如，模型可以识别出‘攻击’、‘站立’、‘坐下’等具体动作，这对于监控系统、体育分析和安全监控等领域具有重要意义。

实际应用

在实际应用中，myAVA数据集被广泛用于开发智能监控系统和行为分析工具。例如，在公共安全领域，通过分析监控视频中的动作，可以及时发现和预防潜在的安全威胁。在体育领域，该数据集支持开发运动员动作分析系统，帮助教练和运动员优化训练和比赛策略。

衍生相关工作

基于myAVA数据集，研究者们开发了多种先进的动作识别模型和算法。例如，一些研究工作利用该数据集训练深度学习模型，如SlowFast和MMAction2，以提高动作识别的准确性和实时性。此外，还有研究探讨了如何结合其他传感器数据（如音频和加速度计）来进一步增强动作识别的性能。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集