T2ISafety
收藏T2ISafety 数据集概述
数据集简介
T2ISafety 是一个用于评估文本到图像(T2I)模型安全性的基准数据集。该数据集旨在解决当前T2I模型在生成有害、偏见或隐私内容方面的潜在风险。T2ISafety 通过三个关键领域(毒性、公平性和偏见)对T2I模型进行评估,并构建了一个包含12个任务和44个类别的详细层次结构。数据集包含70K个对应的提示词,并基于这些提示词生成了68K张手动标注的图像。
数据集特点
- 紧凑的层次结构分类:T2ISafety 提出了一个包含三个层次的结构化分类体系,涵盖3个领域、12个任务和44个类别。
- 先进的评估框架:包括专门为图像微调的评估器 ImageGuard。
数据集构建
T2ISafety 数据集的构建过程包括三个关键阶段:提示词构建、图像生成和人工标注。数据集展示了在公平性、毒性和隐私三个主要领域的提示词-图像对。T2ISafety 是从提示词构建阶段后的一个独特子集中衍生出来的。
模型架构
T2ISafety 使用了一个名为 ImageGuard 的评估器,其网络架构包括视觉编码器、感知采样器和LLM(大语言模型)。视觉表示通过视觉编码器提取,经过感知采样器处理后与标记化的查询一起输入LLM。Transformer层中的CMA模块专注于与安全相关的图像区域。对比损失确保视觉特征与其描述之间的一致性,增强了图像-文本的一致性。门控因子控制模态的合并,以实现鲁棒的多模态理解。
评估结果
T2ISafety 对12个著名的扩散模型进行了评估,揭示了多个问题,包括种族公平性的持续问题、生成有毒内容的倾向,以及即使在使用了概念擦除等防御方法后,模型在隐私保护方面的显著差异。
引用
bibtex @article{libenchmarking, title={Benchmarking Ethics in Text-to-Image Models: A Holistic Dataset and Evaluator for Fairness, Toxicity, and Privacy}, author={Li, Lijun and Shi, Zhelun and Hu, Xuhao and Dong, Bowen and Qin, Yiran and Liu, Xihui and Sheng, Lu and Shao, Jing} }
团队
SALAD-Bench Team




