MRVS_VideoSensemaking

Name: MRVS_VideoSensemaking
Creator: 乔治梅森大学; 弗吉尼亚理工大学; 马里兰大学
Published: 2026-02-10 00:43:37
License: 暂无描述

arXiv2026-02-10 更新2026-02-11 收录

下载链接：

https://github.com/Puqi7/MRVS_VideoSensemaking

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由乔治梅森大学与弗吉尼亚理工大学等机构联合创建，名为MRVS_VideoSensemaking，包含20条地面机器人巡逻视频（10对昼夜配对），每条时长22-30分钟，模拟了38类公共安全相关事件。数据来源于真实校园犯罪记录和10个异常视频数据集，通过22名演员实景拍摄构建。其核心目标是支持多机器人视频感知系统的开发，解决公共安全领域人工视频分析效率低、负担重的问题，为AI增强的态势感知工具提供基准测试环境。

Co-developed by institutions including George Mason University and Virginia Tech, this dataset is named MRVS_VideoSensemaking. It comprises 20 ground robot patrol videos (10 day-night paired sets), each lasting 22 to 30 minutes, which simulate 38 categories of public safety-related incidents. Constructed via on-location filming with 22 actors, the dataset draws on real campus crime records and 10 anomalous video datasets. Its core objectives include supporting the development of multi-robot video perception systems, addressing the issues of low efficiency and heavy workload in manual video analysis within the public safety domain, and providing a benchmark testing environment for AI-augmented situational awareness tools.

提供机构：

乔治梅森大学; 弗吉尼亚理工大学; 马里兰大学

创建时间：

2026-02-10

原始信息汇总

MRVS_VideoSensemaking 数据集概述

基本信息

数据集名称：MRVS_VideoSensemaking
核心描述：一个用于公共安全视频意义建构（Video Sensemaking）的地面机器人测试平台数据集/系统。
关联研究：CHI 2026 论文《Designing Multi-Robot Ground Video Sensemaking with Public Safety Professionals》。

数据集内容与特点

数据形式：视频数据集。
场景类型：包含异常视频与正常视频的对比。
拍摄条件：涵盖白天与夜间场景。
数据来源：由机器人捕获的、由演员表演的“关注事件”（Events-of Interest, EoI）长视频。
关键元素：包含一个定义了“关注事件”（EoI）的表格。

相关资源链接

项目主页：https://puqi7.github.io/MRVS_VideoSensemaking/
论文：https://arxiv.org/abs/2602.08882
数据集地址：https://huggingface.co/datasets/Puqi7/MRVS_anomaly_long_video_dataset
UI演示：https://websitefrontend-jhzm.onrender.com/

搜集汇总

数据集介绍

构建方式

在公共安全领域，多机器人地面视频感知系统的构建面临数据稀缺与场景真实性的双重挑战。MRVS_VideoSensemaking数据集通过严谨的协同设计流程，系统性地构建了一个面向公共安全专业人员的测试平台。研究团队首先整合了来自三个美国校园的三年犯罪记录以及十个公开异常视频数据集，初步筛选出视觉可观测且可模拟的事件类型。随后，与五位公共安全专家合作，通过调查与访谈，最终确定了38类与操作情境紧密相关的事件兴趣点，并依据紧急程度划分为四个优先级。基于此分类体系，研究使用地面机器人搭载高清摄像机，在校园环境中模拟了10条日间与10条条夜间巡逻路线，录制了总时长约470分钟的视频。视频录制过程遵循预设的巡逻脚本，由22名演员自然演绎各类事件，并确保背景环境包含真实、不受控的行人与车辆活动，以维持生态效度。所有视频均经过人脸与车牌匿名化处理，并附有精确的时间戳、GPS坐标及事件标注，构成了一个兼具操作真实性与研究安全性的基准数据集。

使用方法

该数据集主要服务于多机器人视频感知系统的设计、开发与评估。研究人员可利用其作为基准测试平台，验证视频异常检测、事件理解与描述符搜索等计算机视觉算法的性能。具体而言，开发者可基于提供的真值标签，训练或微调模型以识别38类预定义事件，并利用时空元数据评估模型在复杂光照与移动视角下的鲁棒性。在系统交互层面，该数据集支持构建类似MRVS的人机协同界面原型，用于探索多视频流概览、时空推理、基于属性的搜索及团队协作等功能的用户体验。使用前，需从指定开源仓库获取匿名化视频文件及配套标注，并注意其校园环境的局限性。在实际应用中，建议结合领域专家评审，以考察系统对误报、漏报的处理能力及其对工作流效率的实际提升，同时深入考量系统部署涉及的伦理与隐私问题。

背景与挑战

背景概述

MRVS_VideoSensemaking数据集由乔治梅森大学、弗吉尼亚理工大学和马里兰大学的研究团队于2026年联合创建，旨在应对公共安全领域中人手不足与职业伤害率高的严峻挑战。该数据集聚焦于多机器人地面视频感知理解，通过整合地面巡逻机器人捕获的视频流，为公共安全专业人员提供可扩展的态势感知能力。其核心研究问题在于如何设计与集成多机器人视频系统，以优化公共安全工作流程，减轻专业人员负担，并提升事件检测与响应的效率。该数据集的建立填补了多机器人视频感知理解研究领域的空白，为未来智能安防系统的发展奠定了实证基础。

当前挑战

MRVS_VideoSensemaking数据集面临的挑战主要体现在两个方面：在领域问题层面，其致力于解决多机器人视频流中的异常事件检测与感知理解难题，特别是在复杂光照条件、动态视角变化及实时性要求下，如何准确识别与分类38种公共安全相关事件，并平衡检测精度与误报率。在构建过程中，挑战包括如何与多个警察机构合作，定义并模拟真实且符合伦理的异常事件；在保持生态效度的同时，确保视频数据的多样性与标注一致性；以及处理移动机器人视角带来的视频抖动、遮挡与低分辨率等问题，同时需兼顾数据匿名化以保护隐私。

常用场景

经典使用场景

在公共安全领域，多机器人地面视频理解系统面临碎片化视频流整合与实时态势感知的挑战。MRVS_VideoSensemaking数据集通过模拟真实校园巡逻场景，构建了包含38类公共安全相关事件（EoIs）的标注视频库，覆盖昼夜不同光照条件。该数据集最经典的使用场景在于为多机器人视频感知系统的设计与评估提供标准化测试环境，支持研究者开发基于人工智能的视频分析模型，实现自动化异常事件检测与情境理解。其核心价值在于将公共安全专业人士的操作经验转化为可计算的事件分类体系，为机器人巡逻视频的语义解析奠定数据基础。

解决学术问题

该数据集主要解决了多机器人视频流在公共安全应用中存在的三大核心学术问题：一是缺乏与领域专家协同定义的事件分类体系，传统异常检测研究常基于统计稀有性或研究者主观定义，与实战需求脱节；二是缺少面向移动机器人视角的标准化视频基准，现有数据集多基于固定监控视角，难以反映地面机器人动态巡逻中的视觉复杂性；三是人机协同视频感知系统的设计需求不明确，导致技术工具与工作流程整合困难。通过提供专家验证的事件分类、时空同步的多机器人视频流及六项设计需求，该数据集为跨学科研究提供了可复现的实验基础，推动了视频理解、人机交互与公共安全领域的深度融合。

实际应用

在实际应用层面，MRVS_VideoSensemaking数据集支撑了公共安全机构中多机器人巡逻系统的智能化升级。基于该数据集训练的模型可集成至实时监控平台，辅助警务人员在大型活动安防、夜间巡逻、失踪人员搜救等场景中快速定位异常事件。系统能够自动解析多路视频流，生成事件摘要与时空轨迹，显著降低人工巡检的认知负荷与时间成本。同时，数据集强调的隐私保护机制（如人脸与车牌模糊化）为公共场合视频分析提供了合规性范本，助力机构在提升执法效率的同时维护公众信任。这些应用体现了数据集从学术研究向实战部署的关键桥梁作用。

数据集最近研究