PHEVA
收藏PHEVA: Privacy-preserving Human-centric Video Anomaly Detection Dataset
概述
PHEVA 数据集是一个开创性的资源,旨在通过解决与隐私、伦理问题以及视频数据中人类行为的复杂性相关的关键挑战,推动视频异常检测(VAD)的研究。PHEVA 是最大的连续记录 VAD 数据集,提供了跨多样室内和室外场景的综合、去标识化的人类注释。PHEVA 提供两种不同的数据设置:传统训练和持续学习。
异常行为
PHEVA 的个体异常行为包括投掷、举手、躺下和跌倒。在群体情况下,异常行为包括拳打、踢腿、推搡、拉扯、用物体击打和勒颈。
关键特性
- 隐私保护:PHEVA 仅包括去标识化的人类注释,移除所有像素信息以保护隐私。
- 大规模数据:超过 500 万帧带有姿态注释的帧,提供的训练帧数是之前数据集的 5 倍以上,测试帧数是 4 倍以上。
- 特定场景:包括一个专门用于执法和安全人员培训的新型特定场景相机,允许在高度专业化的环境中评估模型。
- 持续学习:PHEVA 支持持续学习的基准测试,弥合了传统训练和实际部署之间的差距。
数据集统计
| 数据集 | 总帧数 | 训练帧数 | 测试帧数 | 正常帧数 | 异常帧数 | 场景数 | 相机数 |
|---|---|---|---|---|---|---|---|
| PHEVA | 5,196,675 | 4,467,271 | 729,404 | 517,286 | 212,118 | 7 | 7 |
如何下载数据集
下载注释、异常标签和分割,请使用以下链接:
注释结构
每个视频都有自己的专用注释文件,格式为 .pkl。文件命名模式为 <camera_number>_<video_number>.pkl。注释文件包含一个字典,格式如下:
python
{
"Frame_number":
{
"Person_ID": [array([Boudning_Box]), array([Keypoints])]
}
}
边界框格式为 XYWH,关键点格式为 XYC。
异常标签结构
异常标签格式为 .npy,每个文件是一个 0 和 1 的数组,长度为视频的帧数。0 表示正常帧,1 表示异常帧。
基准测试结果
在 PHEVA 数据集上对几种最先进的姿态基础 VAD 模型进行了基准测试:
| 模型 | AUC-ROC | AUC-PR | EER | 10ER |
|---|---|---|---|---|
| MPED-RNN | 76.05 | 42.83 | 0.28 | 0.49 |
| GEPC | 62.25 | 28.62 | 0.41 | 0.67 |
| STG-NF | 57.57 | 83.77 | 0.46 | 0.90 |
| TSGAD | 68.00 | 34.61 | 0.36 | 0.64 |
持续基准训练和测试集特性
训练数据中异常帧不到 1%,以模拟真实世界场景。测试集经过编辑,正常帧和异常帧的比例约为 1:1,使 AUC-ROC 和 AUC-PR 等指标更具信息性。
引用
如果您在研究中使用 PHEVA,请引用我们的论文:
@article{noghre2024pheva, title={PHEVA: A Privacy-preserving Human-centric Video Anomaly Detection Dataset}, author={Ghazal Alinezhad Noghre and Shanle Yao and Armin Danesh Pazho and Babak Rahimi Ardabili and Vinit Katariya and Hamed Tabkhi}, journal={Arxiv}, year={2024}, }




