OODCV-VQA, Sketchy-VQA|视觉语言模型数据集|安全性评估数据集
收藏arXiv2023-11-28 更新2024-06-21 收录
下载链接:
https://github.com/UCSC-VLAA/vllm-safety-benchmark
下载链接
链接失效反馈资源简介:
本研究介绍了一个名为OODCV-VQA和Sketchy-VQA的数据集,用于评估视觉语言模型(VLLMs)在分布外(OOD)场景和对抗性攻击下的安全性。OODCV-VQA包含4244个样本,用于测试模型在罕见图像条件下的表现。Sketchy-VQA则专注于评估模型处理抽象草图的能力。这些数据集通过模拟真实世界中不常见的视觉输入,帮助研究人员理解VLLMs在复杂和挑战性环境下的性能。
提供机构:
加州大学圣克鲁兹分校
创建时间:
2023-11-28
