VERI-Emergency

Hugging Face2025-05-25 更新2025-05-26 收录

下载链接：

https://huggingface.co/datasets/Dasool/VERI-Emergency

下载链接

链接失效反馈

官方服务：

资源简介：

VERI-Emergency是一个视觉紧急识别和干预数据集，用于测试视觉语言模型是否能够区分真实的紧急情况与视觉上相似但安全的情况。数据集包含100对对比图像，每对包含一个真实紧急情况的图像和一个视觉上相似但安全的情况的图像。数据集旨在进行上下文感知的安全识别，测试模型是否能够进行常识性视觉推理。

创建时间：

2025-05-22

原始信息汇总

VERI-Emergency 数据集概述

📌 数据集基本信息

名称: VERI-Emergency (Visual Emergency Recognition and Intervention Dataset)
类型: 视觉问答任务数据集
语言: 英语 (en)
许可证: MIT
论文链接: arXiv:2505.15367
代码仓库: GitHub
联系方式: dasolchoi@yonsei.ac.kr

📊 数据集结构

数据量:
- 训练集: 200个样本
- 总大小: 21,954,967字节
- 下载大小: 21,912,605字节
特征字段:
- image: 图像数据
- image_id: 图像ID字符串
- risk_identification: 风险标识("danger"或"safe")
- category: 类别标识("AB"/"PME"/"ND")
- caption: 图像描述
- emergency_response: 应急响应指南(仅危险图像)

🎯 数据集特点

核心内容: 包含100对对比图像(真实紧急情况与视觉相似的安全场景)
设计目的: 测试视觉语言模型(VLMs)的上下文感知安全识别能力
关键评估维度:
- 超越表面视觉的常识性视觉推理
- 区分真实紧急情况与安全场景的能力

🗂️ 类别体系

代码	全称	描述	示例
AB	事故与不安全行为	环境或人为行为导致的直接物理危险	交通事故、高处坠落、溺水风险、工具使用不当
PME	个人医疗紧急情况	个人面临的紧急健康风险	心脏骤停、窒息、昏迷、严重伤害、过敏反应
ND	自然灾害	影响多人的大规模威胁	火灾、洪水、地震、建筑物倒塌、飓风

🛠️ 支持任务

风险识别: 判断图像是否描述危险情况
应急响应: 为危险图像生成上下文适当的响应
图像描述: 提供详细的场景级描述(隐式任务)

📥 数据加载方式

python from datasets import load_dataset dataset = load_dataset("Dasool/VERI-Emergency")

示例用法

dangerous_images = dataset[train].filter(lambda x: x[risk_identification] == danger) category_data = dataset[train].filter(lambda x: x[category] == AB) # 按类别筛选

📜 引用格式

bibtex @misc{choi2025bettersafesorryoverreaction, title={Better Safe Than Sorry? Overreaction Problem of Vision Language Models in Visual Emergency Recognition}, author={Dasol Choi and Seunghyun Lee and Youngsook Song}, year={2025}, eprint={2505.15367}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2505.15367} }

搜集汇总

数据集介绍

构建方式

VERI-Emergency数据集通过精心设计的对比图像对构建而成，每对图像包含一个真实紧急场景和一个视觉相似但安全的场景。研究人员从三个主要类别（事故与不安全行为、个人医疗紧急情况和自然灾害）中收集了100组对比图像，确保覆盖多样化的紧急情境。每个图像均配有详细的场景描述和风险标识，构建过程注重上下文信息的丰富性和视觉相似性的精确控制。

使用方法

使用VERI-Emergency数据集时，可通过Hugging Face的datasets库轻松加载。数据集支持多种任务，包括风险识别、应急响应生成和图像描述。用户可以根据需要过滤特定类别的图像或仅选择危险场景进行分析。加载后的数据以字典形式呈现，包含图像对象、图像ID、风险标识、类别标签、描述文本和应急响应建议，便于直接用于模型训练和评估。

背景与挑战

背景概述

VERI-Emergency数据集由Yonsei University的研究团队于2025年推出，旨在评估视觉语言模型在紧急场景识别中的表现。该数据集聚焦于区分真实紧急情况与视觉相似但安全的情境，涵盖了事故与不安全行为、个人医疗紧急事件以及自然灾害三大类别。通过对比图像对的设计，VERI-Emergency为研究社区提供了一个诊断基准，以测试模型在上下文感知安全识别方面的能力。该数据集的建立填补了视觉推理领域在紧急情境理解方面的空白，为提升模型的常识推理能力提供了重要资源。

当前挑战

VERI-Emergency数据集面临的挑战主要体现在两个方面。其一，在领域问题层面，视觉语言模型往往难以区分表面相似但本质不同的场景，例如厨房火焰的正常烹饪与火灾危险之间的微妙差异。这种上下文依赖性要求模型具备深层次的视觉推理能力。其二，在构建过程中，研究人员需要精心设计对比图像对，确保它们在视觉上高度相似但在语义上截然不同。此外，标注过程中对紧急情况的准确识别与响应建议的生成也需领域专家的深度参与，进一步增加了数据集的构建难度。

常用场景

经典使用场景

在计算机视觉与自然语言处理的交叉领域，VERI-Emergency数据集为视觉语言模型（VLMs）的上下文感知能力评估提供了标准化测试平台。该数据集通过精心设计的对比图像对，要求模型区分真实紧急情况与视觉相似的安全场景，从而检验模型超越表层视觉特征、进行常识推理的能力。这种评估范式已成为衡量视觉语言模型安全识别性能的基准方法。

解决学术问题

该数据集有效解决了视觉语言模型在安全关键场景中的过反应问题，即模型倾向于将视觉相似的安全场景误判为紧急情况。通过提供细粒度的风险分类（事故与不安全行为、个人医疗紧急情况、自然灾害）和上下文丰富的标注，为研究者提供了系统研究模型认知偏差的数据基础，推动了视觉常识推理领域的方法创新。

实际应用

在智能监控系统和紧急响应辅助系统中，VERI-Emergency的训练数据可显著提升系统对真实紧急事件的识别准确率。其标注的应急响应指导可直接集成到城市安防系统，辅助911调度中心快速判断报警真实性。医疗急救领域则利用其PME类别数据优化远程医疗诊断系统的视觉分析模块。

数据集最近研究