Custom ava dataset
收藏github2024-05-14 更新2024-05-31 收录
下载链接:
https://github.com/JasonHuang0119/Custom-ava-dataset_Custom-Spatio-Temporally-Action-Video-Dataset-Windows
下载链接
链接失效反馈官方服务:
资源简介:
自定義ava數據集,多人視頻的時空動作數據集標註方法 使用到 Windows 系統上
Custom AVA dataset, a spatiotemporal action dataset annotation method for multi-person videos, utilized on the Windows system.
创建时间:
2024-03-07
原始信息汇总
数据集概述
数据集名称
- Custom ava dataset, Custom Spatio Temporally Action Video Dataset for Windows
- 自定义ava数据集,多人视频的时空动作数据集标注方法 使用到 Windows 系统上
数据集内容
- 数据集包含从AVA数据集中随机选择的1个视频,从中裁剪出3个10秒的片段。
- 视频文件链接:https://s3.amazonaws.com/ava-dataset/trainval/2DUITARAsWQ.mp4
数据集处理
- 使用ffmpeg进行视频裁剪与抽帧,每秒裁剪30帧。
- 视频裁剪与抽帧的具体操作包括安装ffmpeg、视频裁剪、视频抽帧、整合与缩减帧。
- 通过yolov5与deep sort进行动作检测与关联人的ID。
数据集文件结构
- 数据集的文件结构如图所示:DatasetFolderStructure.png
数据集标注
- 使用VIA工具进行动作标注,标注信息保存为json文件。
- 标注文件中包含视频的名字、视频帧的编号、人的坐标值、动作类别编号。
- 标注完成后,通过python脚本提取标注信息并整合到CSV文件中。
数据集使用
- 数据集主要用于时空动作的检测与标注,适用于Windows系统。
- 数据集处理过程中使用了yolov5和deep sort等工具进行视频分析和动作识别。
数据集下载
搜集汇总
数据集介绍

构建方式
Custom ava dataset 的构建方式主要基于对 AVA 数据集的裁剪与抽帧处理。首先,从 AVA 数据集中随机选择一个视频,并从中裁剪出三个 10 秒的片段。随后,使用 ffmpeg 工具对这些视频片段进行裁剪和抽帧,每秒裁剪 30 帧,生成大量的视频帧。接着,通过整合与缩减帧的操作,将这些帧整合到一个文件夹中,以便后续的检测与标注。整个过程确保了数据集的多样性和实用性,为时空动作识别提供了丰富的素材。
特点
Custom ava dataset 的主要特点在于其时空动作标注的精细性和多样性。该数据集不仅包含了视频帧的裁剪与抽帧,还通过整合与缩减帧的操作,确保了数据集的结构化与高效性。此外,数据集的标注过程采用了 VIA 工具,生成了详细的标注文件,包含了视频帧的编号、人的坐标值以及动作类别编号,为时空动作识别提供了高质量的训练数据。
使用方法
使用 Custom ava dataset 时,首先需要下载并解压数据集文件。随后,可以通过 VIA 工具导入标注文件,进行进一步的标注与分析。对于深度学习模型的训练,数据集的帧文件可以直接用于 YOLOv5 等目标检测模型的输入。此外,数据集的标注文件可以用于生成训练与验证所需的 CSV 文件,进一步支持模型的训练与评估。整个使用流程简单直观,适合多种时空动作识别任务的应用。
背景与挑战
背景概述
Custom ava dataset 是一个专注于多人视频时空动作标注的自定义数据集,旨在为视频分析领域提供高质量的标注数据。该数据集基于 AVA 数据集进行扩展,通过裁剪和抽帧技术,生成了多个 10 秒的视频片段,并对其进行详细的时空动作标注。主要研究人员或机构通过使用 Windows 系统,结合 Anaconda 虚拟环境,利用 ffmpeg 和 yolov5 等工具,完成了数据集的构建与标注。该数据集的创建不仅为视频动作识别研究提供了丰富的资源,还为时空动作检测算法的开发和验证提供了重要的数据支持。
当前挑战
Custom ava dataset 在构建过程中面临多项挑战。首先,视频裁剪和抽帧的精度要求较高,确保每秒 30 帧的抽取质量对后续的标注和检测至关重要。其次,时空动作的标注过程复杂,涉及多人动作的识别与分类,标注的准确性和一致性是关键。此外,数据集的整合与缩减帧的处理,尤其是为 yolov5 检测和 VIA 标注分别进行的处理,增加了数据处理的复杂性。最后,通过 deep sort 进行人员 ID 的关联,确保了标注文件中人员身份的连续性和准确性,但这一过程也增加了算法的复杂度和计算资源的消耗。
常用场景
经典使用场景
Custom ava dataset 主要用于时空动作识别任务,特别是在多人视频场景中。该数据集通过标注视频中的时空动作,为研究人员提供了一个丰富的资源,用于训练和评估动作识别模型。经典的使用场景包括视频中的动作检测、动作分类以及时空动作定位,这些任务在视频监控、体育分析和虚拟现实等领域具有广泛的应用。
衍生相关工作
基于 Custom ava dataset,许多研究工作得以展开,包括改进的时空动作识别算法、多模态数据融合技术以及深度学习模型的优化。这些工作不仅提升了动作识别的准确性,还推动了相关领域的技术进步。例如,一些研究通过结合深度学习和时空特征提取技术,显著提高了动作识别的精度和效率。
数据集最近研究
最新研究方向
在时空动作识别领域,Custom ava dataset 数据集的最新研究方向主要集中在多人在复杂场景中的动作识别与标注。该数据集通过引入自定义的时空动作标注方法,结合深度学习模型如 YOLOv5 和 DeepSORT,实现了对视频中多人的动作检测与跟踪。这一研究方向不仅提升了动作识别的准确性,还为视频分析、智能监控等领域提供了强有力的技术支持。此外,通过与 VIA 标注工具的结合,研究人员能够更高效地生成标注文件,进一步推动了时空动作识别技术的发展。
以上内容由遇见数据集搜集并总结生成



