vcog/vcog-bench

Name: vcog/vcog-bench
Creator: vcog
Published: 2024-06-13 00:27:14
License: 暂无描述

Hugging Face2024-06-13 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/vcog/vcog-bench

下载链接

链接失效反馈

官方服务：

资源简介：

VCog-Bench是一个公开的零样本抽象视觉推理（AVR）基准，旨在评估多模态大语言模型（MLLMs）的性能。该基准整合了两个知名的AVR数据集，并引入了一个新提出的MaRs-VQA数据集。研究发现，当前最先进的MLLMs和视觉语言模型（VLMs）在AVR任务上表现出一定的理解能力，但在复杂的矩阵推理任务上仍面临挑战。通过提供一个稳健的基准，我们旨在推动零样本抽象视觉推理领域的进一步创新和进展。

提供机构：

vcog

原始信息汇总

VCog-Bench: Benchmarking Multimodal LLMs on Abstract Visual Reasoning

数据集描述

VCog-Bench 是一个公开的零样本抽象视觉推理（AVR）基准，旨在评估多模态大语言模型（MLLMs）。该基准整合了两个知名的AVR数据集，并包含了一个新提出的MaRs-VQA数据集。

数据集结构

数据集详情

内容类型: VQA对，包含多张图像输入
数据量:
- RAVEN: 560 VQA对
- MaRs-VQA: 480 VQA对
- CVR: 309 VQA对
数据来源: RAVEN数据集、MaRs-IB、CVR数据集
数据收集方法: 参见论文

5,000+

优质数据集

54 个

任务类型

进入经典数据集