five

SPA-VL|视觉语言模型数据集|数据安全数据集

收藏
arXiv2024-06-18 更新2024-06-20 收录
视觉语言模型
数据安全
下载链接:
https://huggingface.co/datasets/sqrti/SPA-VL
下载链接
链接失效反馈
资源简介:
SPA-VL是一个专为视觉语言模型安全对齐设计的大型高质量数据集,由中国科学技术大学、复旦大学和上海人工智能实验室共同创建。该数据集包含100,788个样本,覆盖6个危害领域、13个类别和53个子类别,旨在通过多样化的视觉和文本信息提升模型的安全性和帮助性。数据集的创建过程涉及系统的图像收集、相关有害内容类别的提问生成以及基于无害性和帮助性的偏好标注。SPA-VL的应用领域主要集中在提升视觉语言模型在处理多模态信息时的安全性和效率,确保模型输出既无害又具有帮助性。
提供机构:
中国科学技术大学,复旦大学,上海人工智能实验室
创建时间:
2024-06-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
SPA-VL数据集的构建过程分为三个阶段:图像收集、问题生成和偏好标注。首先,从LAION-5B数据集中收集多样化的图像,确保涵盖广泛的危害类别。接着,使用Gemini 1.0 Pro Vision生成与图像相关的简单问题、困难问题和困难陈述,确保问题的多样性和复杂性。最后,从12个不同的视觉语言模型中生成响应,并通过GPT-4V进行偏好标注,选择更无害且更有帮助的响应,形成四元组(问题、图像、选择的响应、拒绝的响应)。
特点
SPA-VL数据集具有广泛覆盖和多样性的特点。它涵盖了6个主要危害领域、13个类别和53个子类别,包含100,788个样本。每个图像对应三种类型的问题(简单问题、困难问题和困难陈述),并从多个模型中收集响应,确保响应的多样性。数据集还特别关注无害性和帮助性,旨在通过强化学习从人类反馈(RLHF)技术,提升视觉语言模型的安全性和实用性。
使用方法
SPA-VL数据集主要用于视觉语言模型的安全对齐研究。通过使用PPO(近端策略优化)和DPO(直接偏好优化)等技术,模型可以在该数据集上进行训练,以提升其无害性和帮助性。训练过程中,模型通过对比选择的响应和拒绝的响应,学习生成更符合人类价值观的输出。实验结果表明,使用SPA-VL数据集训练的模型在多个安全评估基准上表现优异,且在不牺牲核心能力的情况下显著提升了安全性。
背景与挑战
背景概述
SPA-VL数据集由Yongting Zhang、Lu Chen等研究人员于2024年提出,旨在解决视觉语言模型(VLMs)在安全对齐方面的挑战。随着VLMs在多模态信息理解中的广泛应用,如何确保这些模型在生成响应时既无害又有效成为了一个关键问题。SPA-VL数据集涵盖了6个主要领域、13个类别和53个子类别,包含100,788个样本,每个样本由问题、图像、选择的响应和拒绝的响应四部分组成。该数据集的构建基于12个开源和闭源的VLMs,确保了响应的多样性。实验结果表明,使用SPA-VL数据集进行对齐训练的模型在无害性和有效性方面均有显著提升。SPA-VL的发布标志着VLMs在安全对齐领域的一个重要里程碑,推动了相关研究的进一步发展。
当前挑战
SPA-VL数据集面临的挑战主要体现在两个方面。首先,VLMs在处理多模态输入时,如何确保生成的响应既无害又有效是一个复杂的任务。尽管现有的语言模型已经进行了无害对齐,但视觉编码器的对齐相对较弱,导致VLMs容易通过视觉模态受到攻击。其次,构建SPA-VL数据集的过程中,研究人员需要处理大量多模态数据,确保数据的多样性和质量。特别是在生成问题和响应时,如何避免模型偏见并确保响应的多样性和安全性是一个技术难点。此外,数据集的构建还需要平衡无害性和有效性,确保模型在提升安全性的同时不牺牲其核心能力。这些挑战使得SPA-VL的构建过程复杂且具有较高的技术要求。
常用场景
经典使用场景
SPA-VL数据集在视觉语言模型(VLMs)的安全对齐研究中具有广泛的应用。该数据集通过提供包含问题、图像、选择响应和拒绝响应的四元组样本,帮助研究人员训练和评估模型在生成无害且有用的响应方面的能力。经典的使用场景包括使用强化学习从人类反馈(RLHF)技术,如PPO和DPO,对模型进行安全对齐训练,以确保模型在面对多模态输入时能够生成符合人类价值观的响应。
解决学术问题
SPA-VL数据集解决了视觉语言模型在安全对齐方面的关键学术问题。首先,它填补了大规模、高质量安全对齐数据集的空白,使得研究人员能够更有效地训练模型以应对复杂的多模态输入。其次,该数据集通过涵盖6个主要领域、13个类别和53个子类别的广泛有害内容,帮助模型识别和避免生成有害响应。实验结果表明,使用SPA-VL数据集训练的模型在无害性和有用性方面均有显著提升,同时保持了核心能力。
衍生相关工作
SPA-VL数据集的推出催生了一系列相关研究工作。例如,基于该数据集的研究进一步探索了多模态模型在安全对齐中的表现,提出了新的对齐算法和评估方法。此外,SPA-VL数据集还被用于开发更复杂的视觉语言模型,如LLaVA和MiniGPT-4,这些模型在安全性和性能上均取得了显著进步。未来,SPA-VL数据集有望在更多领域推动视觉语言模型的安全对齐研究,特别是在涉及复杂推理和生成任务的应用中。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国高分辨率高质量PM2.5数据集(2000-2023)

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。

国家青藏高原科学数据中心 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录