five

NWPU Campus|视频异常检测数据集|校园安全数据集

收藏
arXiv2023-05-23 更新2024-06-21 收录
视频异常检测
校园安全
下载链接:
https://campusvad.github.io
下载链接
链接失效反馈
资源简介:
NWPU Campus数据集是由西北工业大学计算机学院创建的大型半监督视频异常检测基准,包含43个场景、28类异常事件和16小时视频。该数据集是目前最大的半监督VAD数据集,也是首个考虑场景依赖异常和视频异常预测的数据集。数据集内容丰富,包括日常行为和多种异常行为,如单人异常、交互异常和场景依赖异常等。创建过程中,通过在校园户外地点设置摄像头记录行人和车辆活动,并由志愿者参与表演正常和异常事件。该数据集适用于视频异常检测和预测研究,旨在提前预警异常事件,以防止危险事故和减少生命财产损失。
提供机构:
西北工业大学计算机学院
创建时间:
2023-05-23
AI搜集汇总
数据集介绍
main_image_url
构建方式
NWPU Campus数据集的构建基于43个校园户外场景的视频采集,涵盖了28类异常事件和16小时的视频内容。数据采集过程中,超过30名志愿者参与了正常和异常事件的模拟,以确保数据的多样性和真实性。训练集仅包含正常事件,而测试集则包含正常和异常事件,且所有测试视频均进行了帧级标注,以指示异常事件的存在与否。此外,为了保护隐私,所有视频中的人脸均进行了模糊处理。
特点
NWPU Campus数据集是目前最大的半监督视频异常检测数据集,具有43个场景、28类异常事件和16小时的视频时长。其独特之处在于首次引入了场景依赖型异常事件,即同一事件在不同场景下可能表现为正常或异常。此外,该数据集还首次提出了视频异常预测任务,旨在提前预测异常事件的发生,填补了该领域的研究空白。数据集中的异常事件类型多样,涵盖了单人异常、交互异常、群体异常等多种形式,且正常事件也包含了日常行为,如行走、骑车等。
使用方法
NWPU Campus数据集可用于半监督视频异常检测和异常预测任务。在异常检测任务中,模型仅使用正常事件进行训练,并在测试阶段区分正常与异常事件。异常预测任务则要求模型基于当前帧预测未来是否会发生异常事件。数据集提供了帧级标注,便于模型评估。此外,研究者可以使用该数据集验证模型在处理场景依赖型异常和异常预测任务中的表现,并通过与其他现有数据集的对比,评估模型的泛化能力和鲁棒性。
背景与挑战
背景概述
NWPU Campus数据集是由西北工业大学计算机科学与技术学院的曹聪琪、卢悦、王鹏和张艳宁等人于2023年提出的一个半监督视频异常检测与预测的综合性基准数据集。该数据集旨在解决视频异常检测(VAD)领域中的场景依赖异常问题,并首次引入了视频异常预测(VAA)任务。NWPU Campus包含43个场景、28类异常事件以及16小时的视频数据,是目前规模最大、场景最多、异常类别最丰富的半监督VAD数据集。其独特之处在于首次考虑了场景依赖异常,即某些行为在特定场景下是正常的,而在其他场景下则被视为异常。该数据集的提出填补了现有数据集在场景依赖异常和异常预测任务上的空白,推动了视频异常检测领域的研究进展。
当前挑战
NWPU Campus数据集在构建和应用过程中面临多重挑战。首先,视频异常检测领域的主要挑战在于异常事件的多样性和罕见性,导致模型难以从有限的正常数据中学习到异常模式。其次,场景依赖异常的引入增加了数据集的复杂性,要求模型能够理解不同场景下的行为语义差异。此外,视频异常预测任务要求模型能够基于当前帧预测未来可能发生的异常事件,这对模型的时序建模能力提出了更高的要求。在数据集构建过程中,如何设计多样化的异常事件、确保场景的多样性以及保护参与者的隐私也是重要的挑战。这些挑战不仅推动了数据集的创新设计,也为未来的算法研究提供了新的方向。
常用场景
经典使用场景
NWPU Campus数据集在视频异常检测(VAD)和异常预测(VAA)领域具有广泛的应用。其经典使用场景包括智能监控系统中的异常行为检测,尤其是在多场景环境下,能够有效识别场景依赖的异常事件。例如,数据集中的场景依赖异常检测可以区分同一行为在不同场景下的正常与异常表现,如操场上的踢球行为是正常的,而在道路上踢球则被视为异常。
衍生相关工作
NWPU Campus数据集的发布推动了视频异常检测和预测领域的多项研究。基于该数据集,研究者提出了多种先进的算法模型,如基于前向-后向帧预测的场景条件自编码器模型,该模型能够同时处理异常检测和预测任务,并在多个基准数据集上取得了领先的性能。此外,该数据集还激发了关于场景依赖异常检测和长期异常预测的研究,进一步拓展了视频异常分析的应用边界。
数据集最近研究
最新研究方向
近年来,视频异常检测(VAD)领域的研究逐渐从单一场景的异常检测转向多场景、复杂事件的检测与预测。NWPU Campus数据集的提出填补了当前研究中场景依赖异常检测和视频异常预测的空白。该数据集不仅包含了43个场景和28类异常事件,还首次引入了场景依赖异常和视频异常预测任务,为智能监控系统提供了更为全面的评估基准。前沿研究主要集中在基于预测和重建的模型上,尤其是通过双向帧预测和场景条件自编码器来处理场景依赖异常和预测未来异常事件。这些方法在NWPU Campus数据集上表现出色,显著提升了异常检测和预测的准确性,推动了VAD领域的技术进步。
相关研究论文
  • 1
    A New Comprehensive Benchmark for Semi-supervised Video Anomaly Detection and Anticipation西北工业大学计算机学院 · 2023年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

VQA

我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题,任务是提供准确的自然语言答案。反映许多现实世界的场景,例如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,与生成通用图像说明的系统相比,在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外,VQA 适合自动评估,因为许多开放式答案仅包含几个单词或一组封闭的答案,可以以多项选择的形式提供。我们提供了一个数据集包含 100,000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线,并与人类表现进行了比较。

OpenDataLab 收录

jpft/danbooru2023

Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。

hugging_face 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录