five

MSAD Dataset|异常检测数据集|多场景数据集

收藏
github2024-10-29 更新2024-10-30 收录
异常检测
多场景
下载链接:
https://github.com/Tom-roujiang/MSAD
下载链接
链接失效反馈
资源简介:
我们提出了一种新的多场景异常检测(MSAD)数据集,这是一个高分辨率的现实世界异常检测基准,涵盖了多种场景和异常情况,包括人类和非人类相关的异常。
创建时间:
2024-10-25
原始信息汇总

MSAD - A Benchmark for Video Anomaly Detection

数据集概述

  • 名称: MSAD (Multi-Scenario Anomaly Detection)
  • 类型: 视频异常检测数据集
  • 分辨率: 高分辨率
  • 场景: 包含多样化的真实世界场景和异常情况,包括人类和非人类相关的异常
  • 发布机构: 由Liyun Zhu, Lei Wang, Arjun Raj, Tom Gedeon, Chen Chen等人发布
  • 发布会议: 2024 NeurIPS Dataset and Benchmark Track

数据集访问

使用限制

  • 用途: 仅限学术和研究目的
  • 禁止行为: 商业用途、复制、分发或销售数据集及其衍生作品

基准测试方法

  • 方法:
    • RTFM
    • MGFN
    • UR-DMU (待完成)

引用

  • 论文标题: Advancing Video Anomaly Detection: A Concise Review and a New Dataset
  • 作者: Liyun Zhu, Lei Wang, Arjun Raj, Tom Gedeon, Chen Chen
  • 年份: 2024
  • arXiv链接: https://arxiv.org/abs/2402.04857
AI搜集汇总
数据集介绍
main_image_url
构建方式
MSAD数据集的构建基于对多种现实场景的深入分析,旨在提供一个高分辨率、真实世界异常检测的综合基准。该数据集涵盖了广泛的人类和非人类相关的异常情况,通过精心挑选和标注的视频片段,确保了数据的多样性和代表性。构建过程中,研究团队严格遵循科学的数据采集和处理流程,确保每一段视频都经过多重验证,以保证数据的高质量和可靠性。
特点
MSAD数据集的显著特点在于其多场景和高分辨率的特性,这使得它能够支持复杂场景下的异常检测任务。数据集不仅包含了多种异常类型,还提供了视频级别的标注,便于进行弱监督学习。此外,MSAD数据集还提供了预提取的特征(如I3D和Video-Swin Transformer),这大大简化了研究者的数据处理工作,提高了实验效率。
使用方法
使用MSAD数据集进行研究时,研究者可以通过项目网站提交申请,获取原始视频数据或预提取的特征。数据集支持多种弱监督方法的基准测试,如RTFM、MGFN等。研究者可以根据提供的训练和测试文件列表,按照指定的评估协议(如Protocol ii)进行实验。值得注意的是,该数据集仅限于学术和研究用途,任何商业用途均被严格禁止。
背景与挑战
背景概述
MSAD数据集,全称为Multi-Scenario Anomaly Detection Dataset,是由Liyun Zhu、Lei Wang、Arjun Raj、Tom Gedeon和Chen Chen等研究人员在2024年NeurIPS会议上提出的一个高分辨率、真实世界异常检测基准。该数据集涵盖了多种场景和异常情况,包括与人类和非人类相关的异常。MSAD数据集的创建旨在推动视频异常检测领域的发展,通过提供一个包含多样化场景和异常的基准,帮助研究人员在更广泛的应用场景中验证和改进其算法。该数据集的发布标志着视频异常检测领域的一个重要里程碑,为学术界和工业界提供了一个强大的工具来评估和提升异常检测技术。
当前挑战
MSAD数据集在构建过程中面临了多重挑战。首先,收集和标注高分辨率、多样化的视频数据是一项复杂且耗时的任务,尤其是在涉及真实世界场景时。其次,数据集中包含了多种类型的异常,这要求标注过程必须精确且一致,以确保数据的质量和可靠性。此外,数据集的构建还需要考虑到隐私和伦理问题,确保所有数据的使用符合学术和研究目的。在应用层面,MSAD数据集的挑战在于如何有效地利用其丰富的场景和异常信息,开发出能够在不同环境下表现优异的异常检测算法。这些挑战不仅推动了数据集的构建,也激发了研究人员在算法设计和评估方法上的创新。
常用场景
经典使用场景
MSAD数据集在视频异常检测领域中具有广泛的应用,其经典使用场景包括但不限于对多场景视频中的异常行为进行检测与分类。通过提供高分辨率的实景视频数据,该数据集支持研究人员在复杂环境中识别和分析异常事件,如公共场所的安全监控、工业生产线的故障检测等。其多样化的场景和异常类型,使得MSAD数据集成为评估和改进视频异常检测算法的重要工具。
解决学术问题
MSAD数据集解决了视频异常检测领域中常见的学术研究问题,如在多场景和多类型异常情况下,如何有效区分正常与异常行为。该数据集通过提供丰富的视频数据和详细的标注,帮助研究人员开发和验证新的算法,从而提高检测的准确性和鲁棒性。其高分辨率和真实世界的数据特性,使得研究成果更具实际应用价值,推动了视频异常检测技术的发展。
衍生相关工作
MSAD数据集的发布催生了多项相关经典工作,推动了视频异常检测领域的研究进展。例如,基于MSAD数据集,研究人员开发了多种弱监督学习方法,如RTFM、MGFN等,这些方法在视频异常检测任务中表现出色。此外,MSAD数据集还激发了对多场景异常检测的深入研究,促进了跨领域技术的融合与创新。这些衍生工作不仅丰富了视频异常检测的理论体系,也为实际应用提供了强有力的技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

CMNEE(Chinese Military News Event Extraction dataset)

CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。

github 收录

LFW (Labeled Faces in the Wild)

Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。

OpenDataLab 收录

FMA (Free Music Archive)

免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集

OpenDataLab 收录