SAGE
收藏github2025-08-05 更新2025-08-06 收录
下载链接:
https://github.com/M-E-AGI-Lab/PSAlign
下载链接
链接失效反馈官方服务:
资源简介:
SAGE(Safety-Aware Generation for Everyone)是首个用于文本到图像生成中个性化安全对齐的数据集,使模型能够适应个体用户特征(如年龄、文化等)。关键特征包括:100K+带有“安全”与“不安全”变体的图像-提示对;10个安全类别(如骚扰、暴力)涵盖800+有害概念;用户元数据(年龄、性别、宗教等)用于个性化;分为train/val/test_seen/test_unseen以进行稳健评估。
SAGE (Safety-Aware Generation for Everyone) is the first dataset for personalized safety alignment in text-to-image generation, enabling models to adapt to individual user characteristics such as age, culture, and other relevant factors. Its key features include: over 100K image-prompt pairs with "safe" and "unsafe" variants; 10 safety categories (e.g., harassment, violence) covering more than 800 harmful concepts; user metadata (age, gender, religion, etc.) for personalized alignment; and dataset splits into train/val/test_seen/test_unseen for robust evaluation.
创建时间:
2025-07-31
原始信息汇总
PSAlign数据集概述
数据集基本信息
- 名称: SAGE (Safety-Aware Generation for Everyone)
- 用途: 用于文本到图像生成中的个性化安全对齐
- 开发者: M-E-AGI-Lab
- 相关论文: Personalized Safety Alignment for Text-to-Image Diffusion Models
数据集特点
- 数据量: 100K+ 图像-提示对
- 安全类别: 10个安全类别,涵盖800+有害概念
- 用户元数据: 包含年龄、性别、宗教等个性化信息
- 数据划分: 训练集(train)、验证集(val)、测试集(test_seen/test_unseen)
数据集结构
data/sage/ ├── [train/val/test_seen/test_unseen]/ │ ├── metadata.jsonl # 包含提示、标签和用户资料 │ └── [image files] # 图像文件
下载与安装
- 下载地址: Google Drive
- 安装步骤: bash mkdir -p data/ mv ~/Downloads/sage.zip data/ unzip data/sage.zip -d data/
相关资源
引用
bibtex @article{lei2025psalign, title={Personalized Safety Alignment for Text-to-Image Diffusion Models}, author={Yu Lei and Jinbin Bai and Qingyu Shi and Aosong Feng and Kaidong Yu}, journal={arXiv preprint arXiv:2508.01151}, year={2025} }
搜集汇总
数据集介绍

构建方式
在文本到图像生成领域,个性化安全对齐的需求日益凸显。SAGE数据集作为该领域的开创性资源,其构建过程融合了多维度考量。研究团队通过系统化采集超过10万组图像-提示词对,精心设计安全与不安全变体,覆盖骚扰、暴力等10大类安全类别及800余种有害概念。数据标注过程中整合了用户年龄、性别、宗教等元数据,并采用训练集/验证集/测试集(含可见与不可见场景)的四重划分策略,确保模型评估的严谨性。
特点
SAGE数据集在个性化安全研究领域具有显著优势。其核心价值体现在涵盖丰富的用户画像维度,能够精准反映不同年龄层、文化背景群体的安全需求差异。数据集特别设计了平行安全样本对,为模型提供明确的对比学习信号。技术层面采用分层抽样策略,确保各类安全风险场景的均衡覆盖,同时通过不可见测试集有效验证模型的泛化能力。这种结构化设计使SAGE成为评估个性化安全对齐效果的理想基准。
使用方法
该数据集的应用遵循标准化流程。用户需从指定云端存储下载压缩包,解压至项目数据目录后,系统将自动识别按预设结构组织的图像文件与元数据。研究实践中,数据集支持端到端的模型训练与评估流程:通过调用专用脚本可启动适配器训练,利用元数据字段实现用户画像的条件控制,最终在测试集上验证个性化安全策略的有效性。数据集目录中的详细说明文档为不同应用场景提供了操作指引。
背景与挑战
背景概述
SAGE数据集(Safety-Aware Generation for Everyone)是首个专注于文本到图像生成中个性化安全对齐的数据集,由TeleAI、北京大学、耶鲁大学和新加坡国立大学的研究团队于2025年联合发布。该数据集旨在解决生成式AI模型在适应不同用户特征(如年龄、性别、文化背景)时的安全性与个性化需求之间的矛盾,为PSAlign框架提供核心训练与评估基础。其包含10万+图像-提示对,覆盖10类安全风险领域,通过用户元数据实现动态安全阈值调整,推动了生成式AI在医疗、教育等敏感场景的合规应用。
当前挑战
构建SAGE数据集面临双重挑战:在领域问题层面,需精准界定跨文化敏感内容的边界,例如同一图像在不同宗教背景下可能具有截然不同的安全评级;在技术实现层面,需平衡数据规模与标注质量,其中涉及800+有害概念的细粒度分类要求多学科专家协作。此外,用户隐私保护与数据多样性之间的张力导致样本采集困难,特别是未成年人等特殊群体的数据需符合严格伦理规范。动态安全阈值的量化建模进一步增加了数据标注的复杂性,需设计兼顾用户特征与生成内容可控性的评估体系。
常用场景
经典使用场景
在文本到图像生成领域,SAGE数据集为研究者提供了一个独特的平台,用于探索个性化安全对齐技术。该数据集通过包含大量带有安全标签的图像-提示对,支持模型在生成过程中根据用户特征动态调整安全阈值。经典使用场景包括训练和评估扩散模型的安全对齐能力,特别是在处理敏感内容时,如暴力、骚扰等类别,同时保持图像质量和创意表达。
解决学术问题
SAGE数据集解决了文本到图像生成中的关键学术问题,即如何在保持生成内容多样性和质量的同时,实现个性化的安全过滤。通过提供丰富的用户元数据和详细的安全标注,该数据集支持研究者在不同用户群体(如不同年龄、文化背景)中测试和优化安全策略,填补了现有研究中个性化安全对齐数据的空白。
衍生相关工作
SAGE数据集衍生了多项经典工作,包括PSAlign框架及其轻量级适配器技术,这些工作进一步推动了文本到图像生成领域的安全研究。相关研究还涉及基于强化学习的安全对齐方法(如DiffusionDPO)和跨文化安全策略优化,为后续研究提供了重要的技术基础和评估标准。
以上内容由遇见数据集搜集并总结生成



