HASARD
收藏arXiv2025-03-11 更新2025-03-13 收录
下载链接:
https://sites.google.com/view/hasard-bench/
下载链接
链接失效反馈官方服务:
资源简介:
HASARD是一个专为基于视觉的嵌入式安全强化学习设计的基准测试,由埃因霍温科技大学和利物浦大学共同开发。该数据集包含六个不同的随机环境,具有复杂的3D场景,要求安全策略和更高阶的推理。这些环境分为三个难度级别,并提供两种动作空间。HASARD的特点是模拟现实世界的导航和交互,同时保持计算效率。它旨在为视觉基础的安全RL研究提供一个低成本、高效的探索平台。
提供机构:
埃因霍温科技大学, 利物浦大学
创建时间:
2025-03-11
搜集汇总
数据集介绍

构建方式
HASARD数据集的构建基于ViZDoom平台,这是一种轻量级的强化学习研究工具,允许从经典FPS游戏Doom的引擎中学习原始视觉输入。HASARD包含了六个随机环境,使用Action Code Script (ACS)语言开发,旨在模拟复杂和视觉丰富的3D场景,要求综合的安全策略和高阶推理。每个环境都设计了三个难度级别,通过调整配置参数和引入新的机制来增加复杂性。HASARD使用第一人称视角,捕捉每帧为160×120像素的8位RGB格式图像,并提供了简化动作空间选项,以缩短训练循环并强调安全强化学习原则。
特点
HASARD数据集的特点包括:1)多样化的3D环境,要求策略决策、空间关系理解和短期预测;2)三个难度级别和两种动作空间,允许逐步增加挑战性;3)通过热图可视化训练过程中的代理导航,提供学习方法洞察;4)可调整的安全预算,允许在奖励和安全之间进行平衡;5)基于ViZDoom的轻量级模拟,实现快速的环境迭代。
使用方法
使用HASARD数据集的方法包括:1)选择适当的难度级别和动作空间,以匹配研究需求;2)利用Sample-Factory框架进行快速模拟和训练;3)分析代理的导航模式,通过热图可视化来理解学习方法;4)调整安全预算,以探索奖励和安全之间的不同权衡;5)使用简化或完整动作空间,根据任务复杂性进行选择。
背景与挑战
背景概述
HASARD数据集是于2025年由Eindhoven University of Technology和University of Liverpool的研究人员Tristan Tomilin, Meng Fang, Mykola Pechenizkiy共同创建的。该数据集旨在通过一系列复杂且多样化的任务来推动基于视觉的强化学习在具身智能体中的应用。HASARD的核心研究问题是如何在保持安全性的前提下,让智能体在三维环境中进行有效的导航和交互。它为研究者和开发者提供了一个平台,用于评估、分析和提升具身智能体的能力。该数据集的发布对相关领域产生了深远的影响,因为它填补了现有视觉基础3D数据集在任务复杂性和多样性方面的空白,为安全强化学习研究提供了一个新的基准。
当前挑战
HASARD数据集面临的主要挑战包括:1) 所解决的领域问题:如何在保证安全的前提下,让智能体在复杂的三维环境中进行有效的导航和交互。2) 构建过程中所遇到的挑战:由于HASARD数据集基于ViZDoom游戏引擎,其物理和视觉真实度与真实世界相比有所不足,这限制了直接将学习到的行为应用到现实场景中。此外,Doom游戏中的大部分交互动作是离散的,这简化了控制挑战,而全动作空间的使用则增加了学习问题的复杂性。最后,HASARD环境中的任务通常只有一个目标和安全约束,而现实世界中的任务可能涉及多个目标和安全约束,因此,如何扩展HASARD以适应更复杂的场景也是一个挑战。
常用场景
经典使用场景
HASARD数据集主要用于评估基于视觉的强化学习算法在具有身体形态的智能体中的安全性能。该数据集提供了多样化的任务,要求智能体进行战略决策、理解空间关系以及预测短期未来,从而模拟真实世界中的复杂交互场景。
实际应用
HASARD数据集的实际应用场景包括自动驾驶、机器人导航和无人机操作等需要视觉感知和决策安全性的领域。通过在HASARD上进行训练,智能体可以学习如何在复杂的动态三维环境中安全地导航和交互,为这些领域的实际应用提供理论基础。
衍生相关工作
HASARD数据集的推出促进了相关经典工作的衍生。例如,基于HASARD的环境设置和任务设计,研究人员可以进一步开发新的安全强化学习算法,或者在现有算法的基础上进行改进和优化。此外,HASARD的数据和结果也可以为其他研究提供参考和比较,推动整个领域的进步。
以上内容由遇见数据集搜集并总结生成



