VLSBench

github2024-12-03 更新2024-12-06 收录

下载链接：

https://github.com/hxhcreate/VLSBench

下载链接

链接失效反馈

官方服务：

资源简介：

VLSBench是一个多模态视觉无泄漏安全基准，旨在防止图像到文本查询的视觉安全泄漏，包含2.4k图像-文本对。该数据集对开源和闭源的多模态大语言模型（如LLaVA、Qwen2-VL、Llama3.2-Vision和GPT-4o）提出了显著挑战，表明在无视觉安全泄漏的多模态安全场景中，多模态对齐是一个更有前景的解决方案。

VLSBench is a multimodal visual leakage-free safety benchmark designed to prevent visual security leaks in image-to-text query scenarios. It comprises 2.4k image-text pairs. This dataset presents substantial challenges to both open-source and closed-source multimodal large language models (e.g., LLaVA, Qwen2-VL, Llama3.2-Vision, and GPT-4o), demonstrating that multimodal alignment is a more promising solution for multimodal security scenarios free of visual security leaks.

创建时间：

2024-11-21

原始信息汇总

VLSBench: Unveiling Information Leakage in Multimodal Safety

数据集概述

名称: VLSBench
描述: VLSBench是一个多模态视觉无泄漏安全基准，旨在防止图像到文本查询的视觉安全泄漏问题。该数据集包含2.4k个图像-文本对，用于评估多模态大语言模型（MLLMs）的安全性能。

数据集下载

下载地址: Huggingface
快速访问: data.json

数据集示例

示例: 数据集中包含一些图像-文本对的示例，展示了数据集的内容和结构。

使用方法

支持的模型架构:
- openai
- llava
- llava_hf
- llava_next
- qwen2vl
- mllama
使用步骤:
1. 从Huggingface下载数据集，并指定下载目录为ROOT_DIR。
2. 执行以下命令进行评估： bash python eval.py --arch llava --data_root $ROOT_DIR --output_dir ./outputs

引用

bibtex @article{hu2024vlsbench, title={VLSBench: Unveiling Visual Leakage in Multimodal Safety}, author={Xuhao Hu and Dongrui Liu and Hao Li and Xuanjing Huang and Jing Shao}, journal={arXiv preprint arXiv:2411.19939}, year={2024} }

搜集汇总

数据集介绍

构建方式

在多模态大型语言模型（MLLMs）的安全性研究中，VLSBench数据集应运而生，旨在揭示视觉安全信息泄露（VSIL）问题。该数据集通过精心设计，构建了2.4k个图像-文本对，确保图像中的潜在风险和敏感内容未在文本查询中泄露。这一构建方式旨在模拟真实世界场景，避免现有多模态安全基准中常见的视觉安全信息泄露现象，从而为MLLMs的安全性评估提供更为真实和挑战性的测试环境。

使用方法

使用VLSBench数据集进行研究时，首先需从Huggingface下载数据集，并将其存储路径指定为`ROOT_DIR`。随后，可根据需求选择不同的模型架构，如openai、llava、llava_hf、llava_next、qwen2vl和mllama等，并在`eval.py`脚本中进行配置。例如，通过执行`python eval.py --arch llava --data_root $ROOT_DIR --output_dir ./outputs`命令，即可对LLaVA模型进行评估。此外，若使用OpenAI API，还需在`load_openai.py`中指定模型名称和API密钥。

背景与挑战

背景概述

在多模态大型语言模型（MLLMs）的应用中，安全性问题逐渐成为重要议题。特别是，先前研究揭示了一种反直觉现象：通过文本遗忘来对齐MLLMs，其安全性表现与使用图像-文本对训练的MLLMs相当。为解释这一现象，研究者发现现有多模态安全基准中存在视觉安全信息泄露（VSIL）问题，即图像中的潜在风险和敏感内容已在文本查询中暴露。为应对这一问题，研究团队构建了视觉无泄漏安全基准（VLSBench），该基准包含2.4k图像-文本对，旨在防止从图像到文本查询的安全信息泄露。VLSBench的创建时间为2024年11月，主要研究人员包括Xuhao Hu、Dongrui Liu、Hao Li、Xuanjing Huang和Jing Shao，其核心研究问题在于揭示和解决多模态安全场景中的视觉信息泄露问题，对提升MLLMs的安全性具有重要影响。

当前挑战

VLSBench在构建过程中面临的主要挑战包括：首先，识别和排除图像-文本对中的视觉安全信息泄露问题，确保数据集的真实性和有效性。其次，设计有效的评估方法，以验证多模态大型语言模型在处理无泄漏图像-文本对时的安全性表现。此外，VLSBench还需应对现有模型在处理此类数据时的性能瓶颈，如LLaVA、Qwen2-VL、Llama3.2-Vision和GPT-4o等模型在VLSBench上的表现均显示出显著挑战。这些挑战不仅涉及数据集构建的技术难题，还包括对多模态安全领域未来研究方向的深远影响。

常用场景

经典使用场景

在多模态安全领域，VLSBench数据集的经典使用场景主要集中在评估和提升多模态大语言模型（MLLMs）的安全性能。通过提供2.4k个图像-文本对，该数据集旨在揭示并解决视觉安全信息泄露（VSIL）问题，即图像中的敏感内容在文本查询中被泄露的现象。研究者可以利用VLSBench来测试和改进模型在处理敏感图像时的拒绝能力，确保模型在实际应用中的安全性。

解决学术问题

VLSBench数据集解决了多模态安全研究中的一个关键问题，即视觉安全信息泄露（VSIL）。通过构建一个防止视觉安全泄露的基准，该数据集为学术界提供了一个标准化的测试平台，用以评估和提升多模态大语言模型在处理敏感图像时的安全性。这不仅有助于推动相关领域的研究进展，还为实际应用中的模型安全提供了理论支持。

实际应用

在实际应用中，VLSBench数据集可用于训练和验证多模态大语言模型在处理敏感图像时的安全性能。例如，在医疗影像分析、社交媒体内容审核等领域，模型需要能够识别并拒绝处理包含敏感信息的图像。通过使用VLSBench，开发者可以确保其模型在这些场景中具备高度的安全性和可靠性，从而提升用户体验和数据保护水平。

数据集最近研究