BadLIBERO

Name: BadLIBERO
Creator: 奥克兰大学
Published: 2025-10-10 19:09:36
License: 暂无描述

arXiv2025-10-10 更新2025-11-19 收录

下载链接：

https://hf-mirror.com/datasets/ZZR42/BadLIBERO

下载链接

链接失效反馈

官方服务：

资源简介：

BadLIBERO数据集是基于LIBERO基准测试构建的，它包含了各种物理触发器和相应的目标导向后门动作。该数据集共有240条数据，用于研究目标导向的后门攻击，旨在使受攻击的视觉语言动作模型在物理触发器存在时执行预定义和目标导向的动作，而在无触发器时表现正常。数据集通过将后门动作轨迹和触发器颜色等因素进行系统分析，为未来的攻击策略设计提供了指导。

The BadLIBERO dataset is built upon the LIBERO benchmark, which encompasses various physical triggers and corresponding goal-directed backdoor actions. Comprising a total of 240 samples, this dataset is developed for research on goal-directed backdoor attacks, aiming to enable compromised vision-language action models to execute predefined and goal-directed actions when physical triggers are present, while maintaining normal behavior in the absence of triggers. By systematically analyzing factors including backdoor action trajectories and trigger colors, the dataset provides guidance for the design of future attack strategies.

提供机构：

奥克兰大学

创建时间：

2025-10-10

搜集汇总

数据集介绍

构建方式

在视觉-语言-动作模型安全研究领域，BadLIBERO数据集基于广泛使用的LIBERO基准构建而成。该数据集通过人工操作员使用3Dconnexion SpaceMouse设备，严格遵循原始LIBERO协议采集数据。构建过程中针对四个任务套件分别收集了12个后门演示样本，每个样本均通过向场景中注入物理对象作为触发器，并记录对应的目标导向动作轨迹。数据注入率控制在10%左右，确保在保持原始任务性能的同时有效植入后门行为模式。

使用方法

该数据集主要用于评估视觉-语言-动作模型在面对物理对象触发时的安全性能。研究人员可将BadLIBERO数据集与原始LIBERO基准混合，构建带后门的训练数据集用于模型训练。在评估阶段，通过向测试场景中引入特定物理触发器，观察模型是否执行预设的目标导向动作。数据集支持对触发物体颜色、尺寸、形状等参数的系统性研究，同时提供三级评估标准来量化攻击效果，为模型安全性分析提供全面可靠的实验基础。

背景与挑战

背景概述

BadLIBERO数据集于2025年由奥克兰大学与阿卜杜拉国王科技大学联合研发，聚焦于具身智能领域中的视觉-语言-动作模型安全威胁研究。该数据集基于主流的LIBERO基准构建，旨在揭示VLA模型在依赖未经验证训练数据时面临的后门攻击风险。研究团队通过引入物理对象作为触发机制，探索了目标导向型后门攻击对机器人决策系统的潜在影响，为构建可信赖的具身智能系统提供了重要实证基础。

当前挑战

该数据集需解决具身智能系统中目标导向型后门攻击的检测难题，包括物理触发器的隐蔽性设计与多模态攻击路径的识别。构建过程中面临三大挑战：一是需在保持原始任务性能的同时嵌入恶意行为模式，二是物理触发器与场景的语义融合需满足自然性要求，三是动作轨迹的多模态特性导致后门行为难以准确定义。实验表明，触发物体颜色与抓取难度会显著影响攻击成功率，而传统基于数字补丁的攻击评估体系难以有效衡量目标导向型攻击效果。

常用场景

经典使用场景

在具身智能安全研究领域，BadLIBERO数据集作为首个针对视觉-语言-动作模型的物理后门攻击基准，被广泛应用于评估VLA模型在数据投毒场景下的脆弱性。该数据集基于LIBERO基准构建，通过注入包含物理触发器的恶意演示样本，系统性地研究目标导向的后门攻击模式。研究人员利用该数据集可模拟现实环境中攻击者仅通过污染训练数据即可操控机器人执行预定恶意行为的安全威胁。

解决学术问题

BadLIBERO有效解决了具身智能安全领域的关键学术问题：一是揭示了VLA模型对未筛选训练数据的高度依赖性所带来的安全风险，二是突破了传统后门攻击仅导致任务失败的局限，实现了对机器人行为的精确目标控制。该数据集通过构建物理对象触发机制与三级评估体系，为研究数据投毒攻击对多模态模型的影响提供了标准化实验环境，推动了鲁棒性VLA模型防御机制的发展。

实际应用

在实际应用层面，BadLIBERO深刻警示了智能机器人系统在现实部署中的安全隐患。当VLA模型使用被污染的开放数据集进行训练时，攻击者可通过在环境中放置特定物理对象（如带有毒性标识的盒子），诱导服务机器人执行危险操作。这种攻击模式在家庭服务、工业制造等场景中具有显著威胁，促使产业界加强数据供应链安全审计，并推动建立可信机器人系统的认证标准。

数据集最近研究