SafeSora-Eval

Hugging Face2024-06-20 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/PKU-Alignment/SafeSora-Eval

下载链接

链接失效反馈

官方服务：

资源简介：

SafeSora是一个旨在支持文本到视频生成领域的安全对齐研究的人类偏好数据集，旨在提高大型视觉模型（LVMs）的帮助性和无害性。该数据集包含三类数据：一个包含57k+文本-视频对的分类数据集（SafeSora-Label），涉及12种伤害标签的多标签分类；一个人类偏好数据集（SafeSora），包含51k+实例，涉及帮助性和无害性的比较关系及四个帮助性子维度；以及一个评估数据集（SafeSora-Eval），包含600个人类编写的提示，其中300个为安全中性提示，另外300个根据12种伤害类别构建的红队提示。

创建时间：

2024-06-10

原始信息汇总

数据集卡片 for SafeSora

概述

SafeSora 是一个人类偏好数据集，旨在支持文本到视频生成领域的安全对齐研究，目标是提升大型视觉模型（LVMs）的有用性和无害性。该数据集目前包含三种类型的数据：

分类数据集（SafeSora-Label）：包含超过 57,000 个文本-视频对，包括 12 种伤害标签的多标签分类。
人类偏好数据集（SafeSora）：包含超过 51,000 个实例，涉及文本到视频生成任务中的有用性和无害性的比较关系，以及四个有用性的子维度。
评估数据集（SafeSora-Eval）：包含 600 个人类编写的提示，其中 300 个是安全中性的，另外 300 个是根据 12 种伤害类别构建的红队提示。

评估数据集

评估数据集包含 600 个人类编写的提示，包括 300 个安全中性提示和 300 个红队提示。这些红队提示是基于 12 种有害类别构建的。这些提示不会出现在训练集中，保留给研究人员用于模型评估的视频生成。

搜集汇总

数据集介绍

构建方式

SafeSora-Eval数据集的构建基于人类编写的提示词，旨在支持文本到视频生成领域的安全性对齐研究。该数据集包含600条提示词，其中300条为安全性中立的提示词，另外300条则根据12种有害类别构建，作为红队提示词。这些提示词未出现在训练集中，专为研究人员生成视频以评估模型的安全性而设计。

使用方法

SafeSora-Eval数据集的使用方法主要围绕模型安全性评估展开。研究人员可以利用该数据集中的提示词生成视频，并通过对比模型在安全性中立和有害提示词上的表现，评估其安全性和对齐效果。此外，数据集还可用于开发基线对齐算法，进一步推动文本到视频生成领域的安全性研究。

背景与挑战

背景概述

SafeSora-Eval数据集由PKU-Alignment团队开发，旨在支持文本到视频生成领域的安全对齐研究。该数据集创建于2023年，专注于提升大型视觉模型（LVMs）的有益性和无害性。SafeSora-Eval包含600个人工编写的提示词，其中300个为安全中性提示词，另外300个基于12种有害类别构建的红色团队提示词。这些提示词专门用于模型评估，确保其不出现在训练集中。该数据集为研究人员提供了一个重要的工具，以评估和改进文本到视频生成模型的安全性和对齐性。

当前挑战

SafeSora-Eval数据集面临的挑战主要集中在两个方面。首先，文本到视频生成领域的安全对齐问题本身具有复杂性，尤其是在确保生成内容的有益性和无害性方面。模型需要在生成高质量视频的同时，避免产生有害或冒犯性内容。其次，数据集的构建过程中，如何准确分类和标注12种有害类别，以及如何设计有效的红色团队提示词，都是极具挑战的任务。这些挑战要求研究人员在数据标注和模型评估中保持高度的精确性和严谨性，以确保数据集的有效性和可靠性。

常用场景

经典使用场景

SafeSora-Eval数据集在文本到视频生成领域的研究中，主要用于评估大型视觉模型（LVMs）的安全性和无害性。通过提供600个人工编写的提示，包括300个安全中立的提示和300个基于12种有害类别的红队提示，研究人员可以利用这些数据生成视频，进而评估模型在生成内容时的安全性和无害性表现。

解决学术问题

SafeSora-Eval数据集解决了在文本到视频生成过程中模型可能产生的有害内容问题。通过提供详细的提示和评估框架，研究人员能够系统地分析模型在不同情境下的表现，从而推动模型在安全性和无害性方面的改进。这一数据集为研究社区提供了一个标准化的评估工具，有助于提升模型在生成内容时的伦理和安全标准。

实际应用

在实际应用中，SafeSora-Eval数据集可用于开发和测试文本到视频生成模型的安全性和无害性。例如，在社交媒体平台、新闻媒体和娱乐行业中，该数据集可以帮助开发人员确保生成的内容不会包含有害或冒犯性的信息。此外，该数据集还可用于教育和培训领域，帮助开发人员理解和应对模型生成内容中的潜在风险。

数据集最近研究