SCAM

Hugging Face2025-04-05 更新2025-04-07 收录

下载链接：

https://huggingface.co/datasets/BLISS-e-V/SCAM

下载链接

链接失效反馈

官方服务：

资源简介：

SCAM数据集是目前最大且最多样化的现实世界印刷攻击数据集，包含了跨越数百个对象类别和攻击词的图像。该数据集旨在研究和评估多模态基础模型对抗印刷攻击的鲁棒性。

创建时间：

2025-04-03

搜集汇总

数据集介绍

构建方式

在计算机视觉与多模态模型安全研究领域，SCAM数据集通过精心设计的构建流程填补了真实世界排版攻击数据的空白。该数据集采用混合采集策略，既包含从现实场景捕获的1,162个带有排版攻击的图像样本，又通过合成技术生成SynthSCAM变体作为补充。每个样本均经过严格的标准化处理，涵盖660种物体类别和206个攻击词汇，特别注重安全敏感词汇的覆盖，确保数据在攻击场景多样性方面的代表性。原始图像与攻击处理版本（NoSCAM）的配对设计，为模型鲁棒性研究提供了精准的对照基准。

特点

作为当前规模最大、多样性最丰富的真实世界排版攻击数据集，SCAM的突出特点体现在其多维度的攻击覆盖体系。数据集不仅包含日常词汇攻击，更系统整合了安全关键领域的敏感词汇，构建起层次化的攻击评估框架。独特的三角数据结构（原始图像/真实攻击/合成攻击）支持跨模态脆弱性的对比研究，而精细标注的660类物体标签则实现了细粒度攻击效果分析。这种兼顾广度与深度的设计，使该数据集成为评估多模态基础模型安全性的黄金标准。

使用方法

研究者可通过Hugging Face数据集库快速加载SCAM数据集，标准化的接口设计支持一键获取三种数据变体。典型使用流程包括：导入load_dataset模块后指定BLISS-e-V/SCAM路径，通过split参数选择训练或测试集。数据集返回包含图像张量和元数据的结构化对象，支持直接输入主流计算机视觉框架。为充分发挥其科研价值，建议结合官方提供的攻击词分类体系进行分层评估，并利用NoSCAM清洁数据作为基线参照。配套的GitHub仓库包含详细的评估脚本和可视化工具链，可辅助开展深入的脆弱性分析。

背景与挑战

背景概述

SCAM数据集由BLISS e.V.社区于2025年推出，旨在填补当前多模态基础模型在对抗排版攻击研究领域的空白。作为迄今规模最大、多样性最丰富的真实世界排版攻击数据集，SCAM涵盖了660个物体类别和206个攻击词汇，其核心研究聚焦于评估多模态基础模型对文本嵌入图像这类对抗样本的鲁棒性。该数据集通过融合真实场景与合成样本，为计算机视觉与人工智能安全交叉领域提供了重要的基准测试平台，相关研究成果已发表于计算机视觉顶刊arXiv。

当前挑战

在解决多模态模型安全评估这一前沿问题时，SCAM面临双重挑战：领域层面需克服传统攻击数据集规模有限、攻击场景单一的问题，通过构建跨数百个物体类别的复杂攻击样本，揭示模型在开放环境中的真实漏洞；数据构建过程中，研究团队需精确平衡攻击词汇的语义覆盖范围与视觉显著性，同时确保合成攻击的物理合理性，这对样本采集、标注标准化及数据平衡性提出了极高要求。

常用场景

经典使用场景

SCAM数据集作为当前最大且最具多样性的真实世界排版攻击数据集，广泛应用于评估多模态基础模型对抗排版攻击的鲁棒性。研究人员通过该数据集能够系统地测试模型在面临各类排版干扰时的表现，从而揭示模型在视觉与文本联合理解中的潜在漏洞。数据集涵盖数百种物体类别和攻击词汇，为模型鲁棒性研究提供了丰富的测试场景。

实际应用

在工业实践中，SCAM数据集被广泛应用于智能内容审核系统的压力测试。科技公司利用该数据集模拟恶意用户可能发起的排版攻击，评估系统在识别篡改图像时的准确率。教育机构则将其作为多模态安全研究的教学案例，帮助学生理解现代AI系统的安全挑战。数据集还为政府监管部门制定AI安全标准提供了实证依据。

衍生相关工作

基于SCAM数据集的研究已催生多项重要学术成果。在CVPR等顶级会议上，多篇论文探讨了不同架构模型对排版攻击的敏感性差异。部分工作提出了新型对抗训练策略，显著提升了模型鲁棒性。数据集还启发了针对多模态模型安全性的系统性评估框架开发，为后续研究奠定了方法论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集