ExtremeAIGC

Name: ExtremeAIGC
Creator: 美国加州大学圣地亚哥分校, 摩洛哥费兹欧洲大学, 澳大利亚麦考瑞大学
Published: 2025-03-13 10:10:29
License: 暂无描述

arXiv2025-03-13 更新2025-03-18 收录

下载链接：

http://arxiv.org/abs/2503.09964v1

下载链接

链接失效反馈

官方服务：

资源简介：

ExtremeAIGC数据集是由美国加州大学圣地亚哥分校、摩洛哥费兹欧洲大学和澳大利亚麦考瑞大学的研究人员创建的。该数据集包含3141张基于29个重大极端事件生成的图片和1047个文本提示，旨在评估大型多模态模型对AI生成极端内容的抵抗力。数据集中的图片使用了三种先进的图像生成模型（FLUX、SDXL和Stable Diffusion 3）生成，并且通过自动化和人工筛选确保了高质量。该数据集的应用领域主要是为了评估和改进多模态模型的安全机制，以防止AI生成极端内容。

The ExtremeAIGC Dataset was created by researchers from the University of California, San Diego in the United States, the University of Europe in Fez, Morocco, and Macquarie University in Australia. This dataset contains 3,141 images generated based on 29 major extreme events and 1,047 text prompts, aiming to evaluate the robustness of large multimodal models against AI-generated extreme content. The images in the dataset were generated using three cutting-edge image generation models: FLUX, SDXL, and Stable Diffusion 3, and their high quality was ensured through both automated screening and manual review. The core application scenario of this dataset is to evaluate and improve the safety mechanisms of multimodal models to prevent AI from generating extreme content.

提供机构：

美国加州大学圣地亚哥分校, 摩洛哥费兹欧洲大学, 澳大利亚麦考瑞大学

创建时间：

2025-03-13

搜集汇总

数据集介绍

构建方式

ExtremeAIGC数据集的构建过程分为四个主要阶段。首先，通过公开资源和历史记录，研究人员精心挑选了29个极端主义事件，并为每个事件提取了相关属性（如人物、地点、组织等）。其次，利用GPT-4生成多样化的图像生成提示，确保每个属性-主题对生成三个独特的文本提示。接着，使用三种先进的图像生成模型（FLUX、SDXL和Stable Diffusion 3）生成高质量图像。最后，通过自动和手动过滤，剔除低质量或不相关的图像，确保数据集的准确性和多样性。

特点

ExtremeAIGC数据集的特点在于其广泛覆盖了200年间的29个极端主义事件，涵盖了极化或情感内容、虚假信息、招募和攻击策划等四大主题。数据集包含3141张高质量图像，这些图像由1047个文本提示生成，确保了内容的多样性和复杂性。此外，数据集还采用了多种图像生成模型，进一步增强了其代表性和实用性。ExtremeAIGC的独特之处在于其不仅包含AI生成的图像，还涵盖了历史事件的全面覆盖，为评估多模态模型的安全性提供了坚实的基础。

使用方法

ExtremeAIGC数据集主要用于评估多模态模型（LMMs）在面对AI生成的极端主义内容时的脆弱性。研究人员可以通过该数据集测试模型在对抗性攻击下的表现，特别是通过生成式和优化式攻击策略来评估模型的安全性。数据集的使用方法包括将AI生成的图像与文本提示结合，模拟真实世界的极端主义场景，并通过自动化指标和人工评估来量化模型的漏洞。此外，数据集还可用于开发更强大的安全机制，以应对日益复杂的对抗性攻击。

背景与挑战

背景概述

ExtremeAIGC数据集由Bhavik Chandna、Mariam Aboujenane和Usman Naseem等研究人员于2025年提出，旨在评估大型多模态模型（LMMs）在面对AI生成的极端主义内容时的脆弱性。该数据集通过模拟真实世界事件和恶意用例，结合先进的图像生成技术，生成了多样化的文本和图像示例，揭示了LMMs在应对极端主义内容时的显著弱点。ExtremeAIGC的提出填补了现有数据集在极端主义内容评估方面的空白，尤其是在AI生成图像、多样化图像生成模型和历史事件覆盖方面的不足。该数据集不仅为研究LMMs的安全性提供了重要工具，还推动了相关领域对模型鲁棒性和防御策略的进一步探索。

当前挑战

ExtremeAIGC数据集面临的挑战主要体现在两个方面。首先，在解决领域问题上，LMMs在处理多模态输入时，尤其是文本与图像结合的场景下，容易受到‘越狱’攻击的影响，导致生成有害内容。尽管现有的安全机制如强化学习和内容过滤器已得到应用，但图像生成技术的快速发展使得这些防御措施显得滞后。其次，在数据集构建过程中，研究人员需要克服生成高质量、多样化极端主义内容的挑战，同时确保数据集的覆盖范围广泛且具有代表性。此外，如何在不影响模型实用性的前提下增强其安全性，也是当前研究中的一大难题。

常用场景

经典使用场景

ExtremeAIGC数据集主要用于评估大型多模态模型（LMMs）在面对AI生成的极端主义内容时的脆弱性。通过模拟真实世界的事件和恶意用例，该数据集提供了多样化的文本和图像示例，帮助研究人员测试模型在面对极端主义内容时的鲁棒性。其经典使用场景包括对LMMs进行对抗性攻击测试，尤其是通过图像和文本的多模态输入来绕过模型的安全机制。

解决学术问题

ExtremeAIGC数据集填补了现有数据集在极端主义内容评估方面的空白，特别是缺乏AI生成图像和多样化图像生成模型的问题。通过引入AI生成的极端主义内容，该数据集帮助研究人员系统量化不同攻击策略的成功率，揭示了当前防御机制中的关键漏洞。这不仅推动了多模态模型安全性的研究，还为开发更强大的防御策略提供了数据支持。

衍生相关工作

ExtremeAIGC数据集衍生了一系列相关研究工作，特别是在多模态模型的安全性和对抗性攻击领域。例如，基于该数据集的研究提出了多种对抗性攻击技术，如FigStep和HADES，这些技术通过嵌入视觉提示来绕过模型的安全机制。此外，该数据集还推动了针对多模态模型的防御策略研究，如基于强化学习的内容过滤和跨模态对齐技术的改进。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集