SPHAR
收藏github2024-05-23 更新2024-05-31 收录
下载链接:
https://github.com/AlexanderMelde/SPHAR-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
SPHAR是一个用于人行动识别的视频数据集,主要用于支持公共场所活动分析的研究。该数据集包含7759个视频,来自14个行动类别,所有视频均从类似监控摄像头的角度拍摄,并经过时空剪辑以确保每个视频只包含一个行动。
SPHAR is a video dataset designed for human action recognition, primarily aimed at supporting research in the analysis of activities in public spaces. The dataset comprises 7,759 videos across 14 action categories. All videos are captured from perspectives similar to surveillance cameras and have undergone spatiotemporal editing to ensure each video contains only a single action.
创建时间:
2020-07-17
原始信息汇总
数据集概述
基本信息
- 名称: SPHAR (Surveillance Perspective Human Action Recognition)
- 类型: 视频数据集
- 目的: 用于人行动识别研究,特别是在公共场所活动分析领域。
- 视频数量: 7759
- 类别数量: 14
- 视频来源: 11个不同的数据源
- 数据集大小: 6.2 GB
- 发布年份: 2020
视频详情
- 视频格式: H265 HEVC .mp4
- 处理: 视频经过剪辑和裁剪,确保每个视频只包含一个动作。
- 类别分布: 每个类别的视频数量从8到2800不等。
数据集构成
- 主要来源: SPHAR自建数据集,包含401个打击、120个踢击等共计14个类别的视频。
- 其他来源: 包括CAVIAR、CASIA、UCF-Aerial等多个公开或研究专用数据集。
示例视频
- 提供了多个类别的示例视频,如跌倒、打击、踢击等。
注意事项
- 由于原始数据集的标注差异,部分视频未能自动裁剪至包含动作的相关区域。
- 不同数据集的视频处理程度不同,部分视频未经过裁剪或裁剪质量依赖于原始标注的质量。
下载与使用
- 数据集可通过GitHub发布页面下载。
- 使用数据集需遵守各视频原始数据集的许可条件。
- 数据集的聚合、转换和裁剪脚本遵循GNU GPL v3许可。
引用信息
- 引用时需注明原始作者,并可使用提供的BibTex条目引用SPHAR数据集的聚合、转换和裁剪工作。
搜集汇总
数据集介绍

构建方式
在构建SPHAR数据集时,研究者们从多个公开数据源中收集了大量视频,这些视频均以监控视角拍摄,涵盖了公共场合中的各种人类行为。视频经过统一格式转换(H265 HEVC .mp4),并进行了时空上的剪裁,以确保每个视频片段仅包含单一行为。此外,所有视频被分类为14种不同的行为类别,从而形成了一个结构化且一致的数据集。
特点
SPHAR数据集的主要特点在于其监控视角的一致性,这使得该数据集在研究公共场合行为分析时具有显著优势。此外,数据集包含了从多个来源整合的视频,涵盖了广泛的行为类别,从日常行为如行走、坐下,到异常行为如暴力和盗窃,提供了丰富的行为样本。
使用方法
使用SPHAR数据集时,用户可以直接下载预处理好的视频文件,或通过克隆GitHub仓库获取构建数据集的脚本。对于研究目的,用户需根据视频文件名中的来源信息,遵守各原始数据集的许可条件。数据集的多样性和结构化特性使其适用于多种人类行为识别算法的训练和评估。
背景与挑战
背景概述
SPHAR数据集,全称为Surveillance Perspective Human Action Recognition Dataset,是一个专注于从监控视角进行人体动作识别的视频数据集。该数据集由Alexander Melde于2020年创建,旨在支持公共场所活动分析的研究。SPHAR汇集了来自多个源数据集的视频,经过统一格式转换、时间和空间上的裁剪,确保每个视频仅包含一个动作,并被分类为14种动作类别。这一数据集的构建不仅丰富了监控视角下的人体动作识别研究资源,还为相关领域的算法开发和评估提供了坚实的基础。
当前挑战
SPHAR数据集在构建过程中面临多项挑战。首先,由于原始数据集的标注差异和缺失,部分视频无法自动裁剪到包含动作的区域,导致视频质量和一致性受到影响。其次,不同源数据集的许可限制复杂,整合过程中需严格遵守各数据集的原始许可条件,增加了数据处理的复杂性。此外,视频来源多样,包括研究专用和非商业用途,这要求使用者在研究中必须明确区分并遵守各视频的许可要求。这些挑战不仅影响了数据集的构建效率,也对后续研究的数据使用提出了更高的合规性要求。
常用场景
经典使用场景
在公共安全领域,SPHAR数据集的经典使用场景主要集中在监控视角下的人类行为识别。该数据集通过收集和整理来自多个源的监控视频,涵盖了14种不同的行为类别,如行走、奔跑、坐下、攻击等。这些视频均从监控视角拍摄,确保了数据的一致性和可比性。研究人员可以利用这些视频进行行为识别算法的训练和测试,从而提高监控系统在复杂环境中的识别准确率。
实际应用
在实际应用中,SPHAR数据集为公共安全监控系统提供了强大的支持。例如,在机场、火车站等公共场所,监控系统可以利用该数据集训练的行为识别模型,实时检测异常行为,如暴力事件、盗窃等,从而及时采取干预措施。此外,该数据集还可用于智能家居、养老院等场景,通过监控居民的行为,提供及时的护理和安全保障。
衍生相关工作
SPHAR数据集的发布催生了多项相关研究工作。例如,有研究者利用该数据集开发了基于深度学习的行为识别模型,显著提高了识别精度。此外,还有研究探讨了如何利用SPHAR数据集进行多视角行为识别,以应对监控视角变化带来的挑战。这些研究不仅推动了行为识别技术的发展,也为公共安全领域的智能化监控提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



