MSAD Dataset|异常检测数据集|多场景数据集
收藏MSAD - A Benchmark for Video Anomaly Detection
数据集概述
- 名称: MSAD (Multi-Scenario Anomaly Detection)
- 类型: 视频异常检测数据集
- 分辨率: 高分辨率
- 场景: 包含多样化的真实世界场景和异常情况,包括人类和非人类相关的异常
- 发布机构: 由Liyun Zhu, Lei Wang, Arjun Raj, Tom Gedeon, Chen Chen等人发布
- 发布会议: 2024 NeurIPS Dataset and Benchmark Track
数据集访问
- 原始视频数据: 需通过在线申请表单提交请求获取
- 提取特征: 提供I3D和Video-Swin Transformer特征
- 特征下载链接: https://anu365.sharepoint.com/:f:/s/msad-dataset/ElG2Uers-Y5GilV-JDHPc6UBaOcGK_vLk3VPzCIN8Oe4KA?e=cHddTR
- 有效期至: 29 Nov 2024
使用限制
- 用途: 仅限学术和研究目的
- 禁止行为: 商业用途、复制、分发或销售数据集及其衍生作品
基准测试方法
- 方法:
- RTFM
- MGFN
- UR-DMU (待完成)
引用
- 论文标题: Advancing Video Anomaly Detection: A Concise Review and a New Dataset
- 作者: Liyun Zhu, Lei Wang, Arjun Raj, Tom Gedeon, Chen Chen
- 年份: 2024
- arXiv链接: https://arxiv.org/abs/2402.04857

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录
LFW (Labeled Faces in the Wild)
Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。
OpenDataLab 收录
FMA (Free Music Archive)
免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集
OpenDataLab 收录