SafetyALFRED

Name: SafetyALFRED
Creator: 密歇根大学; 博伊西州立大学
Published: 2026-04-22 00:27:20
License: 暂无描述

arXiv2026-04-22 更新2026-04-23 收录

下载链接：

https://github.com/sled-group/SafetyALFRED.git

下载链接

链接失效反馈

官方服务：

资源简介：

SafetyALFRED是由密歇根大学团队基于ALFRED基准扩展的多模态安全评估数据集，聚焦厨房场景下的六类现实危害（如设备误用、火灾隐患等）。该数据集包含1001条轨迹数据，通过AI2-THOR环境生成，整合了视觉帧序列、物体元数据及PDDL定义的安全修复动作。其创新性在于首次将静态危害识别与动态具身规划相结合，用于评估大语言模型在完成家务任务时识别和主动消除安全隐患的能力，填补了现有安全基准仅支持问答式评估的空白。

提供机构：

密歇根大学; 博伊西州立大学

创建时间：

2026-04-22

搜集汇总

数据集介绍

构建方式

在具身智能领域，评估多模态大语言模型在动态环境中的主动安全规划能力至关重要。SafetyALFRED数据集基于经典的具身指令跟随基准ALFRED构建，通过在AI2-THOR模拟厨房环境中精心引入六类现实安全风险来扩展原有框架。其构建过程首先对原始场景进行扰动，依据预定义的环境条件在特定位置插入安全隐患，例如将金属物体置于微波炉内或将水敏感物品放入水槽。随后，利用修改后的PDDL领域与问题定义，生成包含风险缓解步骤的真实轨迹，并通过渲染获取逐帧视觉数据与元数据，从而形成一套既包含任务执行又强调安全干预的标准化评估序列。

特点

该数据集的核心特点在于其双重评估框架，旨在揭示模型抽象安全知识与具体物理行为之间的对齐差距。它不仅提供了静态问答任务以检验风险识别能力，更创新地设计了具身规划任务，要求模型在完成家务目标的同时主动缓解即时危险。数据集涵盖的六类厨房安全隐患均源于真实事故统计，包括电器误用、火灾风险及财产损坏等，确保了评估的生态效度。此外，数据集支持纯视觉与元数据增强两种观察模式，能够有效分离感知瓶颈与推理缺陷，为深入分析模型的安全决策机制提供了多维视角。

使用方法

使用SafetyALFRED进行评估时，研究者通常遵循其定义的标准化流程。在问答任务中，模型作为安全评判员，基于给定的目标指令、行动历史及场景观察（图像或元数据），以开放式回答识别潜在风险。在具身任务中，模型则需扮演自主智能体，在相同的观察输入下生成逐步行动计划，且必须在推进主任务前优先执行风险缓解动作。评估指标包括风险识别准确率、缓解成功率及安全对齐率，这些量化结果共同揭示了模型从认知到行动的转化效能。数据集的开源特性允许社区在此基础上进一步开发更鲁棒的安全规划算法与评估范式。

背景与挑战

背景概述

SafetyALFRED数据集由密歇根大学和博伊西州立大学的研究团队于2026年提出，旨在评估多模态大语言模型在具身交互环境中的主动安全规划能力。该数据集建立在经典的具身指令遵循基准ALFRED之上，通过引入六类真实厨房安全隐患进行扩展，核心研究问题聚焦于模型能否将静态场景中的风险识别知识转化为动态环境中的主动风险缓解行为。SafetyALFRED的创建标志着安全评估范式从传统的问答式静态识别向具身情境下纠正性行动执行的转变，对推动安全可靠的自主智能体发展具有重要影响力。

当前挑战

SafetyALFRED数据集所解决的核心领域挑战在于弥合多模态大语言模型在抽象安全知识与具身安全行为之间的对齐鸿沟。具体而言，模型在静态问答任务中虽能较高精度识别安全隐患，但在需要同步执行任务与实施风险缓解的具身规划中表现显著下降，这揭示了现有基于问答的评估范式对物理安全评估的不足。在构建过程中，研究团队面临的主要挑战包括：如何系统性地在仿真厨房环境中定义和实例化六类具有现实意义的安全隐患；如何设计能够同时评估风险识别与缓解能力的双任务评估框架；以及如何确保生成的数据轨迹既能反映真实风险场景，又能支持对模型行为对齐度的量化分析。

常用场景

经典使用场景

在具身人工智能领域，SafetyALFRED数据集主要用于评估多模态大语言模型在动态交互环境中的安全规划能力。该数据集基于ALFRED基准构建，通过引入六类真实厨房安全隐患，系统性地测试模型在完成家务任务时识别风险并主动执行纠正行动的能力。其经典使用场景聚焦于模拟厨房环境中，要求模型在清洗餐具、加热食物等日常操作中，实时检测如微波炉内金属物品、水槽中电子设备等危险状态，并生成包含风险缓解步骤的可执行计划。这种场景设计精准捕捉了模型将抽象安全知识转化为具体行为的关键挑战。

衍生相关工作

SafetyALFRED的发布催生了一系列关注具身安全评估的衍生研究。其揭示的识别-缓解对齐差距启发了多智能体安全框架的探索，研究者通过分离危险识别与任务执行模块，尝试提升系统的整体安全性能。该数据集的设计理念也被后续基准如IS-Bench、SafeAgentBench等继承发展，共同推动了从文本问答到物理交互的安全评估范式演进。同时，其构建方法为如何在现有具身基准中系统注入安全约束提供了技术范本，促进了安全数据集的标准化建设与跨环境泛化研究。

数据集最近研究