Custom ava dataset

github2024-05-14 更新2024-05-31 收录

下载链接：

https://github.com/JasonHuang0119/Custom-ava-dataset_Custom-Spatio-Temporally-Action-Video-Dataset-Windows

下载链接

链接失效反馈

官方服务：

资源简介：

自定義ava數據集，多人視頻的時空動作數據集標註方法使用到 Windows 系統上

Custom AVA dataset, a spatiotemporal action dataset annotation method for multi-person videos, utilized on the Windows system.

创建时间：

2024-03-07

原始信息汇总

数据集概述

数据集名称

Custom ava dataset, Custom Spatio Temporally Action Video Dataset for Windows
自定义ava数据集，多人视频的时空动作数据集标注方法使用到 Windows 系统上

数据集内容

数据集包含从AVA数据集中随机选择的1个视频，从中裁剪出3个10秒的片段。
视频文件链接：https://s3.amazonaws.com/ava-dataset/trainval/2DUITARAsWQ.mp4

数据集处理

使用ffmpeg进行视频裁剪与抽帧，每秒裁剪30帧。
视频裁剪与抽帧的具体操作包括安装ffmpeg、视频裁剪、视频抽帧、整合与缩减帧。
通过yolov5与deep sort进行动作检测与关联人的ID。

数据集文件结构

数据集的文件结构如图所示：DatasetFolderStructure.png

数据集标注

使用VIA工具进行动作标注，标注信息保存为json文件。
标注文件中包含视频的名字、视频帧的编号、人的坐标值、动作类别编号。
标注完成后，通过python脚本提取标注信息并整合到CSV文件中。

数据集使用

数据集主要用于时空动作的检测与标注，适用于Windows系统。
数据集处理过程中使用了yolov5和deep sort等工具进行视频分析和动作识别。

数据集下载

项目代码和数据集可以通过以下链接下载：https://gitee.com/YFwinston/Custom-ava-dataset_Custom-Spatio-Temporally-Action-Video-Dataset.git

搜集汇总

数据集介绍

构建方式

Custom ava dataset 的构建方式主要基于对 AVA 数据集的裁剪与抽帧处理。首先，从 AVA 数据集中随机选择一个视频，并从中裁剪出三个 10 秒的片段。随后，使用 ffmpeg 工具对这些视频片段进行裁剪和抽帧，每秒裁剪 30 帧，生成大量的视频帧。接着，通过整合与缩减帧的操作，将这些帧整合到一个文件夹中，以便后续的检测与标注。整个过程确保了数据集的多样性和实用性，为时空动作识别提供了丰富的素材。

特点

Custom ava dataset 的主要特点在于其时空动作标注的精细性和多样性。该数据集不仅包含了视频帧的裁剪与抽帧，还通过整合与缩减帧的操作，确保了数据集的结构化与高效性。此外，数据集的标注过程采用了 VIA 工具，生成了详细的标注文件，包含了视频帧的编号、人的坐标值以及动作类别编号，为时空动作识别提供了高质量的训练数据。

使用方法

使用 Custom ava dataset 时，首先需要下载并解压数据集文件。随后，可以通过 VIA 工具导入标注文件，进行进一步的标注与分析。对于深度学习模型的训练，数据集的帧文件可以直接用于 YOLOv5 等目标检测模型的输入。此外，数据集的标注文件可以用于生成训练与验证所需的 CSV 文件，进一步支持模型的训练与评估。整个使用流程简单直观，适合多种时空动作识别任务的应用。

背景与挑战

背景概述

Custom ava dataset 是一个专注于多人视频时空动作标注的自定义数据集，旨在为视频分析领域提供高质量的标注数据。该数据集基于 AVA 数据集进行扩展，通过裁剪和抽帧技术，生成了多个 10 秒的视频片段，并对其进行详细的时空动作标注。主要研究人员或机构通过使用 Windows 系统，结合 Anaconda 虚拟环境，利用 ffmpeg 和 yolov5 等工具，完成了数据集的构建与标注。该数据集的创建不仅为视频动作识别研究提供了丰富的资源，还为时空动作检测算法的开发和验证提供了重要的数据支持。

当前挑战

Custom ava dataset 在构建过程中面临多项挑战。首先，视频裁剪和抽帧的精度要求较高，确保每秒 30 帧的抽取质量对后续的标注和检测至关重要。其次，时空动作的标注过程复杂，涉及多人动作的识别与分类，标注的准确性和一致性是关键。此外，数据集的整合与缩减帧的处理，尤其是为 yolov5 检测和 VIA 标注分别进行的处理，增加了数据处理的复杂性。最后，通过 deep sort 进行人员 ID 的关联，确保了标注文件中人员身份的连续性和准确性，但这一过程也增加了算法的复杂度和计算资源的消耗。

常用场景

经典使用场景

Custom ava dataset 主要用于时空动作识别任务，特别是在多人视频场景中。该数据集通过标注视频中的时空动作，为研究人员提供了一个丰富的资源，用于训练和评估动作识别模型。经典的使用场景包括视频中的动作检测、动作分类以及时空动作定位，这些任务在视频监控、体育分析和虚拟现实等领域具有广泛的应用。

衍生相关工作

基于 Custom ava dataset，许多研究工作得以展开，包括改进的时空动作识别算法、多模态数据融合技术以及深度学习模型的优化。这些工作不仅提升了动作识别的准确性，还推动了相关领域的技术进步。例如，一些研究通过结合深度学习和时空特征提取技术，显著提高了动作识别的精度和效率。

数据集最近研究