vlsbench

Hugging Face2024-11-27 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Foreshhh/vlsbench

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是为论文《VLSBench: Unveiling Information Leakage In Multimodal Safety》创建的，主要用于评估当前多模态大语言模型（MLLMs）的安全能力。数据集包含多个特征，如指令ID、指令、图像路径、类别、子类别和来源。数据集的统计信息和示例图像在README中有所展示。数据集的创建旨在用于研究目的，不涉及用户去匿名化，并已通过机构审查委员会（IRB）的审查，不构成人类受试者研究。

创建时间：

2024-11-24

原始信息汇总

VLSBench 数据集概述

基本信息

许可证: Apache 2.0
任务类别: 问答
语言: 英语
标签:
- Safety
- MLLM
- Multimodal
- Multimodal Safety
- VQA
- arxiv:<PAPER ID>
数据集大小: 1K<n<10K

数据集结构

特征:
- instruction_id: 字符串
- instruction: 字符串
- image_path: 字符串
- category: 字符串
- sub_category: 字符串
- source: 字符串

配置

默认配置:
- config_name: default
- data_files:
  - data.json

数据集详情

数据集用途: 用于评估当前多模态大语言模型的安全性能力。
数据集统计:
- 统计图表链接: https://raw.githubusercontent.com/hxhcreate/VLSBench/refs/heads/main/static/images/category_paper.png
示例:
- 示例图表链接: https://raw.githubusercontent.com/hxhcreate/VLSBench/refs/heads/main/static/images/examples.png

伦理声明

研究目的: 该数据集仅用于研究目的，旨在评估当前多模态大语言模型的安全性能力。
数据收集: 数据收集过程不涉及用户去匿名化，并已通过机构审查委员会（IRB）确定不构成人类受试者研究。

搜集汇总

数据集介绍

构建方式

VLSBench数据集的构建旨在揭示多模态安全中的信息泄露问题，其构建过程基于多模态问答任务的需求。数据集通过整合图像路径、指令、类别及子类别等多维度信息，确保数据的多样性和代表性。数据来源经过严格筛选，涵盖了广泛的安全相关场景，并通过人工标注和自动化工具相结合的方式进行数据清洗和验证，确保数据的高质量和可靠性。

特点

VLSBench数据集以其独特的多模态安全评估特性脱颖而出。数据集包含丰富的图像和文本指令对，涵盖了多种安全相关类别和子类别，能够全面评估多模态大语言模型的安全能力。其规模适中，介于1K到10K之间，既保证了数据的广泛性，又便于研究者的高效使用。此外，数据集还提供了详细的元数据信息，如指令ID、来源等，为深入研究提供了便利。

使用方法

使用VLSBench数据集时，研究者可通过Hugging Face平台直接加载数据集，具体代码为`load_dataset('Foreshhh/vlsbench', split='train')`。数据集适用于多模态问答任务，特别是针对多模态大语言模型的安全评估。研究者可通过分析图像与指令的对应关系，评估模型在处理敏感信息时的表现。此外，数据集还提供了详细的统计信息和示例，帮助用户快速理解数据分布和结构。

背景与挑战

背景概述

VLSBench数据集由Xuhao Hu等研究人员于2024年创建，旨在揭示多模态安全领域中的信息泄露问题。该数据集由复旦大学等机构的研究团队开发，主要关注多模态大语言模型（MLLM）在视觉问答（VQA）任务中的安全性评估。通过结合文本指令和图像数据，VLSBench为研究者提供了一个系统性的工具，用于检测和分析多模态模型在处理敏感信息时可能存在的漏洞。该数据集的发布不仅填补了多模态安全研究领域的空白，还为后续的模型优化和安全机制设计提供了重要的数据支持。

当前挑战

VLSBench数据集在解决多模态安全问题的过程中面临多重挑战。首先，多模态模型在处理视觉和文本信息时，往往存在信息泄露的风险，如何准确识别和量化这种泄露是一个复杂的问题。其次，数据集的构建需要确保多样性和代表性，涵盖不同类别和子类别的安全场景，这对数据收集和标注提出了较高的要求。此外，数据集的伦理审查和隐私保护也是构建过程中的关键挑战，确保数据来源合法且不涉及用户去匿名化是数据集得以广泛应用的前提。这些挑战共同构成了VLSBench数据集在推动多模态安全研究中的核心难题。

常用场景

经典使用场景

VLSBench数据集在多模态安全领域的研究中具有重要地位，尤其在评估多模态大语言模型（MLLMs）的安全性方面。研究者通常利用该数据集进行视觉问答（VQA）任务，通过分析模型在处理多模态数据时的信息泄露问题，评估其安全性能。数据集中的指令、图像路径和类别信息为研究者提供了丰富的实验材料，帮助深入理解模型在多模态环境下的表现。

解决学术问题

VLSBench数据集主要解决了多模态大语言模型在信息泄露方面的安全性问题。通过提供包含多种类别和子类别的多模态数据，研究者能够系统地评估模型在处理视觉和文本信息时的潜在风险。该数据集不仅揭示了模型在多模态环境中的安全漏洞，还为改进模型设计提供了数据支持，推动了多模态安全领域的研究进展。

衍生相关工作

VLSBench数据集的发布催生了一系列相关研究，特别是在多模态安全领域。许多研究者基于该数据集提出了新的模型评估方法和安全增强技术。例如，一些工作专注于开发更高效的多模态信息泄露检测算法，而另一些研究则探索了如何通过改进模型架构来减少信息泄露风险。这些研究进一步推动了多模态大语言模型的安全性研究，为相关领域的发展提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集