five

MSSBench

收藏
arXiv2025-09-30 收录
下载链接:
https://mssbench.github.io
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了1,820组语言查询-图像对,其中一半的图像背景是安全的,另一半则是不安全的。这样的设计旨在评估多模态大型语言模型(MLLMs)在情境安全性方面的表现。此外,该数据集被用于分析关键的安全方面,包括显式安全推理、视觉理解以及情境安全推理。该数据集的规模为1,820组,其任务是评估MLLMs在情境安全性方面的性能。

This dataset contains 1,820 language query-image pairs, with half of the images featuring safe backgrounds and the other half featuring unsafe ones. This design aims to evaluate the contextual safety performance of Multimodal Large Language Models (MLLMs). Additionally, this dataset is utilized to analyze key security aspects, including explicit safety reasoning, visual understanding, and contextual safety reasoning. With a total size of 1,820 pairs, its core task is to assess the contextual safety performance of MLLMs.
提供机构:
mssbench.github.io
搜集汇总
背景与挑战
背景概述
MSSBench是一个包含1,820组语言查询-图像对的数据集,其中安全与不安全背景图像各占一半,专门设计用于评估多模态大型语言模型在情境安全性方面的性能表现,并分析其显式安全推理、视觉理解等关键安全能力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作