SAGE

github2025-08-05 更新2025-08-06 收录

下载链接：

https://github.com/M-E-AGI-Lab/PSAlign

下载链接

链接失效反馈

官方服务：

资源简介：

SAGE（Safety-Aware Generation for Everyone）是首个用于文本到图像生成中个性化安全对齐的数据集，使模型能够适应个体用户特征（如年龄、文化等）。关键特征包括：100K+带有“安全”与“不安全”变体的图像-提示对；10个安全类别（如骚扰、暴力）涵盖800+有害概念；用户元数据（年龄、性别、宗教等）用于个性化；分为train/val/test_seen/test_unseen以进行稳健评估。

SAGE (Safety-Aware Generation for Everyone) is the first dataset for personalized safety alignment in text-to-image generation, enabling models to adapt to individual user characteristics such as age, culture, and other relevant factors. Its key features include: over 100K image-prompt pairs with "safe" and "unsafe" variants; 10 safety categories (e.g., harassment, violence) covering more than 800 harmful concepts; user metadata (age, gender, religion, etc.) for personalized alignment; and dataset splits into train/val/test_seen/test_unseen for robust evaluation.

创建时间：

2025-07-31

原始信息汇总

PSAlign数据集概述

数据集基本信息

名称: SAGE (Safety-Aware Generation for Everyone)
用途: 用于文本到图像生成中的个性化安全对齐
开发者: M-E-AGI-Lab
相关论文: Personalized Safety Alignment for Text-to-Image Diffusion Models

数据集特点

数据量: 100K+ 图像-提示对
安全类别: 10个安全类别，涵盖800+有害概念
用户元数据: 包含年龄、性别、宗教等个性化信息
数据划分: 训练集(train)、验证集(val)、测试集(test_seen/test_unseen)

数据集结构

data/sage/ ├── [train/val/test_seen/test_unseen]/ │ ├── metadata.jsonl # 包含提示、标签和用户资料 │ └── [image files] # 图像文件

下载与安装

下载地址: Google Drive
安装步骤: bash mkdir -p data/ mv ~/Downloads/sage.zip data/ unzip data/sage.zip -d data/

引用

bibtex @article{lei2025psalign, title={Personalized Safety Alignment for Text-to-Image Diffusion Models}, author={Yu Lei and Jinbin Bai and Qingyu Shi and Aosong Feng and Kaidong Yu}, journal={arXiv preprint arXiv:2508.01151}, year={2025} }

搜集汇总

数据集介绍

构建方式

在文本到图像生成领域，个性化安全对齐的需求日益凸显。SAGE数据集作为该领域的开创性资源，其构建过程融合了多维度考量。研究团队通过系统化采集超过10万组图像-提示词对，精心设计安全与不安全变体，覆盖骚扰、暴力等10大类安全类别及800余种有害概念。数据标注过程中整合了用户年龄、性别、宗教等元数据，并采用训练集/验证集/测试集（含可见与不可见场景）的四重划分策略，确保模型评估的严谨性。

特点

SAGE数据集在个性化安全研究领域具有显著优势。其核心价值体现在涵盖丰富的用户画像维度，能够精准反映不同年龄层、文化背景群体的安全需求差异。数据集特别设计了平行安全样本对，为模型提供明确的对比学习信号。技术层面采用分层抽样策略，确保各类安全风险场景的均衡覆盖，同时通过不可见测试集有效验证模型的泛化能力。这种结构化设计使SAGE成为评估个性化安全对齐效果的理想基准。

使用方法

该数据集的应用遵循标准化流程。用户需从指定云端存储下载压缩包，解压至项目数据目录后，系统将自动识别按预设结构组织的图像文件与元数据。研究实践中，数据集支持端到端的模型训练与评估流程：通过调用专用脚本可启动适配器训练，利用元数据字段实现用户画像的条件控制，最终在测试集上验证个性化安全策略的有效性。数据集目录中的详细说明文档为不同应用场景提供了操作指引。

背景与挑战

背景概述

SAGE数据集（Safety-Aware Generation for Everyone）是首个专注于文本到图像生成中个性化安全对齐的数据集，由TeleAI、北京大学、耶鲁大学和新加坡国立大学的研究团队于2025年联合发布。该数据集旨在解决生成式AI模型在适应不同用户特征（如年龄、性别、文化背景）时的安全性与个性化需求之间的矛盾，为PSAlign框架提供核心训练与评估基础。其包含10万+图像-提示对，覆盖10类安全风险领域，通过用户元数据实现动态安全阈值调整，推动了生成式AI在医疗、教育等敏感场景的合规应用。

当前挑战

构建SAGE数据集面临双重挑战：在领域问题层面，需精准界定跨文化敏感内容的边界，例如同一图像在不同宗教背景下可能具有截然不同的安全评级；在技术实现层面，需平衡数据规模与标注质量，其中涉及800+有害概念的细粒度分类要求多学科专家协作。此外，用户隐私保护与数据多样性之间的张力导致样本采集困难，特别是未成年人等特殊群体的数据需符合严格伦理规范。动态安全阈值的量化建模进一步增加了数据标注的复杂性，需设计兼顾用户特征与生成内容可控性的评估体系。

常用场景

经典使用场景

在文本到图像生成领域，SAGE数据集为研究者提供了一个独特的平台，用于探索个性化安全对齐技术。该数据集通过包含大量带有安全标签的图像-提示对，支持模型在生成过程中根据用户特征动态调整安全阈值。经典使用场景包括训练和评估扩散模型的安全对齐能力，特别是在处理敏感内容时，如暴力、骚扰等类别，同时保持图像质量和创意表达。

解决学术问题

SAGE数据集解决了文本到图像生成中的关键学术问题，即如何在保持生成内容多样性和质量的同时，实现个性化的安全过滤。通过提供丰富的用户元数据和详细的安全标注，该数据集支持研究者在不同用户群体（如不同年龄、文化背景）中测试和优化安全策略，填补了现有研究中个性化安全对齐数据的空白。

衍生相关工作

SAGE数据集衍生了多项经典工作，包括PSAlign框架及其轻量级适配器技术，这些工作进一步推动了文本到图像生成领域的安全研究。相关研究还涉及基于强化学习的安全对齐方法（如DiffusionDPO）和跨文化安全策略优化，为后续研究提供了重要的技术基础和评估标准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集