Safe-LLaVA

Hugging Face2025-05-15 更新2025-05-16 收录

下载链接：

https://huggingface.co/datasets/kyh9191/Safe-LLaVA

下载链接

链接失效反馈

官方服务：

资源简介：

Safe-LLaVA是一个基于原始LLaVA数据集开发的隐私增强版本，通过使用GPT-4o技术系统移除了敏感的生物特征属性，如性别、种族、年龄、发型、眼色和体重。该数据集旨在为隐私安全的预训练、指令微调和生物特征隐私约束下的视觉语言模型(VLMs)基准测试而设计。

创建时间：

2025-05-05

原始信息汇总

Safe-LLaVA 数据集概述

基本信息

名称: Safe-LLaVA
许可证: bigscience-openrail-m
任务类别: 问答
语言: 英语
标签: 隐私、视觉语言、指令调优、多模态
规模: 100B<n<1T

数据集详情

来源: 基于LLaVA v1.5（包含LAION、COCO、GQA、OCR_VQA、VG等）
隐私策略: 使用GPT-4o重写和过滤，去除生物特征泄露
大小:
- 预训练数据: 558K样本
- 指令调优数据: 665K样本

数据字段

字段名	类型	描述
`id`	string	每张图片的唯一标识符
`image`	string	图片文件的相对路径（仅用于演示）
`conversations`	list	用户和助手之间的对话对

文件描述

文件名	用途
`Safe_blip_laion_cc_sbu_558k.json`	预训练数据集（558K样本）
`Safe_llava_v1_5_mix665k.json`	指令调优数据集（665K样本）
`PRISM_refusal_soft.jsonl`	软提示拒绝基准
`PRISM_refusal_hard.jsonl`	硬提示拒绝基准
`PRISM_implicit_leakage.jsonl`	隐式泄露基准（开放式）
`biometric_images.zip`	PRISM评估中使用的图片文件

基准测试：PRISM

评估内容:
1. 拒绝准确性：模型拒绝回答生物特征相关提示的能力
2. 隐式泄露：在开放式生成中泄露敏感信息的程度

配套资源

GitHub仓库: https://github.com/Kimyounggun99/Safe-LLaVA

搜集汇总

数据集介绍

构建方式

Safe-LLaVA数据集通过系统性地去除原始LLaVA数据集中的敏感生物特征属性构建而成，采用GPT-4o技术进行重写和过滤，确保性别、种族、年龄等敏感信息被有效清除。数据集来源于LLaVA v1.5，整合了LAION、COCO、GQA等多个多模态数据源，涵盖预训练和指令调优两大模块，分别包含558K和665K样本量。

特点

Safe-LLaVA数据集以隐私保护为核心特色，通过严格的生物特征过滤机制，为视觉语言模型提供了安全的训练环境。数据集包含丰富的多模态样本，涵盖图像路径、对话文本等字段，并配备PRISM基准测试套件，可量化评估模型在生物特征拒绝回答和隐式泄露方面的表现。其独特的隐私策略设计，使其成为隐私敏感场景下模型开发的理想选择。

使用方法

使用Safe-LLaVA数据集时，可通过加载预定义的JSON文件获取结构化数据，其中预训练和指令调优数据分别存储于独立文件。PRISM基准测试需结合配套的JSONL文件和图像压缩包进行，通过评估模型在硬性拒绝、软性拒绝及隐式泄露三个维度的表现，全面检验模型的隐私保护能力。配套的GitHub仓库提供了完整的数据处理流程和评估代码。

背景与挑战

背景概述

Safe-LLaVA数据集是一个专注于隐私保护的多模态视觉语言数据集，由研究人员基于LLaVA v1.5数据集开发而成，旨在解决视觉语言模型在处理敏感生物特征信息时的隐私泄露问题。该数据集通过GPT-4o技术对原始数据进行了系统性的改写和过滤，移除了包括性别、种族、年龄、眼睛颜色和体重等敏感属性，从而为隐私安全的预训练、指令微调和基准测试提供了可靠的数据支持。Safe-LLaVA的推出标志着多模态人工智能领域在隐私保护方面迈出了重要一步，为后续研究提供了重要的数据基础和技术参考。

当前挑战

Safe-LLaVA数据集在构建过程中面临多重挑战。首先，如何在保留数据语义完整性的同时彻底移除敏感生物特征信息是一个技术难题，需要精确的自然语言处理和图像分析技术的结合。其次，构建一个能够全面评估模型隐私保护能力的基准测试（如PRISM）需要设计复杂的评估指标和多样化的测试场景。此外，数据集的规模庞大（超过100万条样本），在数据处理和存储效率上也提出了较高要求。这些挑战的解决不仅推动了隐私保护技术的发展，也为多模态模型的伦理应用提供了重要保障。

常用场景

经典使用场景

在隐私保护日益受到重视的背景下，Safe-LLaVA数据集为视觉语言模型的研究提供了安全的数据基础。该数据集通过GPT-4o技术系统性地剔除了原始数据中的敏感生物特征信息，如性别、种族、年龄等，使其成为隐私安全预训练和指令调优的理想选择。研究人员可以在此数据集上开发具有隐私保护能力的多模态模型，同时确保模型在训练过程中不会泄露用户隐私。

解决学术问题

Safe-LLaVA数据集解决了视觉语言模型在训练过程中可能泄露敏感生物特征信息的学术难题。通过提供经过隐私处理的数据，该数据集为研究如何在多模态任务中平衡模型性能与隐私保护提供了重要支持。其PRISM基准测试进一步量化了模型在拒绝回答敏感问题和避免信息泄露方面的表现，推动了隐私保护领域的标准化研究。

衍生相关工作

基于Safe-LLaVA数据集，研究者们已经开展了一系列关于隐私保护视觉语言模型的工作。例如，有研究探索了如何在指令调优过程中进一步强化模型的隐私保护能力，另一些工作则专注于开发更高效的敏感信息过滤算法。这些衍生研究不仅丰富了隐私保护技术的理论体系，也为实际应用提供了更多可能性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集