five

mmbench/MM-SpuBench

收藏
Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mmbench/MM-SpuBench
下载链接
链接失效反馈
官方服务:
资源简介:
MM-SpuBench是一个全面的基准测试,旨在评估多模态大语言模型(MLLMs)对虚假偏见的鲁棒性。该基准测试系统地评估这些模型如何区分核心特征和虚假特征,为理解和量化虚假偏见提供了一个详细的框架。数据集包含2400个视觉问答(VQA)对,数据主要来源于ObjectNet,并包括ImageNet-R(渲染)、ImageNet-Sketch、ImageNet-A和ImageNet-C(使用ImageNet-Hard子集)的数据。

MM-SpuBench是一个全面的基准测试,旨在评估多模态大语言模型(MLLMs)对虚假偏见的鲁棒性。该基准测试系统地评估这些模型如何区分核心特征和虚假特征,为理解和量化虚假偏见提供了一个详细的框架。数据集包含2400个视觉问答(VQA)对,数据主要来源于ObjectNet,并包括ImageNet-R(渲染)、ImageNet-Sketch、ImageNet-A和ImageNet-C(使用ImageNet-Hard子集)的数据。
提供机构:
mmbench
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作