M-Attack-V2-Adversarial-Samples

Name: M-Attack-V2-Adversarial-Samples
Creator: MBZUAI-LLM
Published: 2026-02-21 23:44:25
License: 暂无描述

Hugging Face2026-02-21 更新2026-02-22 收录

下载链接：

https://huggingface.co/datasets/MBZUAI-LLM/M-Attack-V2-Adversarial-Samples

下载链接

链接失效反馈

官方服务：

资源简介：

M-Attack-V2对抗样本数据集包含由M-Attack-V2方法生成的对抗图像样本，源自论文《通过细粒度细节目标推进黑盒LVLM攻击前沿》。该数据集主要用于评估大型视觉语言模型（LVLM）在黑盒设置下的对抗鲁棒性。数据集包含两种配置：epsilon_8（扰动预算ε=8/255）和epsilon_16（扰动预算ε=16/255），每种配置各包含100张224×224 RGB格式的PNG图像，共计200张对抗样本。所有样本均基于NIPS 2017对抗竞赛数据集生成，采用L∞范数约束扰动。该数据集适用于图像分类、视觉问答等任务的对抗攻击研究，特别适合用于多模态模型和黑盒攻击场景的基准测试。

提供机构：

MBZUAI-LLM

创建时间：

2026-02-21

搜集汇总

数据集介绍

构建方式

在对抗性机器学习领域，评估大型视觉语言模型的鲁棒性至关重要。M-Attack-V2-Adversarial-Samples数据集基于NIPS 2017对抗竞赛的标准图像集构建，采用黑盒攻击方法M-Attack-V2生成对抗样本。该攻击策略专注于细粒度细节定位，通过两种不同的扰动预算（ε = 8/255和ε = 16/255，基于L∞范数）对原始224×224 RGB图像施加人眼难以察觉的扰动，最终形成两个独立子集，各包含100张对抗图像，总计200个样本。

使用方法

研究者可利用Hugging Face的datasets库便捷加载该数据集。通过指定配置名称'epsilon_8'或'epsilon_16'，即可分别获取对应扰动预算的子集进行实验。此外，也可直接使用snapshot_download函数将整个数据集下载至本地目录。这些对抗样本主要用于评估大型视觉语言模型在面对精心设计的扰动时的表现，为模型鲁棒性改进与防御机制开发提供关键实验数据。

背景与挑战

背景概述

随着大型视觉语言模型（LVLM）在图像分类与视觉问答等任务中展现出卓越性能，其安全性问题日益凸显。M-Attack-V2-Adversarial-Samples数据集由MBZUAI-LLM团队于2025年创建，源自论文《Pushing the Frontier of Black-Box LVLM Attacks via Fine-Grained Detail Targeting》。该数据集旨在通过生成对抗样本，探索黑盒攻击下LVLM的脆弱性，核心研究问题聚焦于如何利用细粒度细节目标突破模型防御。作为多模态对抗攻击领域的前沿基准，它不仅推动了对抗鲁棒性研究，也为评估模型在实际部署中的安全性提供了关键工具。

当前挑战

该数据集致力于解决多模态对抗攻击领域的核心挑战，即如何在黑盒条件下有效生成针对LVLM的对抗样本，以揭示模型在视觉与语言融合任务中的潜在漏洞。构建过程中面临诸多困难：一方面，需在有限扰动预算（如ε=8/255和16/255）内保持对抗样本的视觉隐蔽性，确保其与原始图像的差异难以察觉；另一方面，生成过程需平衡攻击成功率与样本多样性，同时依赖NIPS 2017竞赛数据集作为源图像，可能受限于原始数据的规模和覆盖范围。这些挑战共同塑造了数据集的技术深度与应用价值。

常用场景

经典使用场景

在对抗性机器学习领域，M-Attack-V2-Adversarial-Samples数据集为评估大型视觉语言模型（LVLM）的鲁棒性提供了关键基准。该数据集通过黑盒攻击方法生成对抗样本，模拟现实世界中恶意攻击者无法访问模型内部参数的情境。研究人员通常利用这些样本测试LVLM在图像分类和视觉问答任务中的脆弱性，从而揭示模型在细微扰动下的行为偏差。这种评估不仅限于单一模型，还可横向比较不同架构的防御能力，为模型安全性的量化分析奠定基础。

解决学术问题

该数据集主要针对对抗性攻击中黑盒场景的学术挑战，解决了传统白盒攻击依赖模型梯度信息的局限性。通过引入细粒度细节定位技术，它能够生成更隐蔽、更具欺骗性的对抗样本，从而推动对抗性机器学习从理论到实践的跨越。其意义在于为LVLM的安全性研究提供了标准化测试平台，促进了鲁棒性评估方法的创新，并加速了防御机制的演进，对保障多模态人工智能系统的可靠部署具有深远影响。

实际应用

在实际应用中，M-Attack-V2-Adversarial-Samples数据集被广泛用于安全关键领域的模型压力测试。例如，在自动驾驶系统中，对抗样本可模拟环境噪声或恶意干扰，评估视觉感知模块的稳定性；在内容审核平台，它帮助检测多模态模型对篡改图像的识别能力。这些测试有助于提前发现模型漏洞，指导工程师设计更健壮的算法，从而降低现实场景中因对抗攻击引发的安全风险，提升人工智能系统的整体可靠性。

数据集最近研究