q-future/q-bench2

Name: q-future/q-bench2
Creator: q-future
Published: 2024-02-23 11:24:28
License: 暂无描述

Hugging Face2024-02-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/q-future/q-bench2

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集是针对低级视觉多模态基础模型的基准测试集，涵盖从单张图像到成对图像的任务。数据集包含多个jsonl文件，每个文件包含图像路径、问题、候选答案和正确答案（或空响应）。图像路径由前缀、两张图像名和_cat_连接组成。数据集还提供了所有单张图像和拼接图像的存储结构，并指导用户如何提交自己的多模态语言和语言模型(MLLM)进行测试。

提供机构：

q-future

原始信息汇总

数据集概述

数据集名称

A Benchmark for Multi-modal Foundation Models on Low-level Vision: from Single Images to Pairs

数据集结构

q-bench2-a1-dev.jsonl: 包含 img_path, question, answer_candidates, correct_answer
q-bench2-a1-test.jsonl: 包含 img_path, question, answer_candidates, 不包含 correct_answer
q-bench2-a2.jsonl: 包含 img_path, empty response

图像路径组织

图像路径格式为 prefix + img1 + _cat_ + img2 + .jpg
示例：img_path 为 "llvisionqa_compare_dev\00079.jpg_cat_09769.jpg.jpg"，则 prefix 为 "llvisionqa_compare_dev"，img1 为 "00079.jpg"，img2 为 "09769.jpg"

图像文件结构

all_single_images: 所有单张图像
llvisionqa_compare_dev: perception-compare 任务的 dev 子集的拼接图像
llvisionqa_compare_test: perception-compare 任务的 test 子集的拼接图像
lldescribe_compare: description-compare 任务的拼接图像

提交格式

Perception-compare 任务 (a1): 组织 jsonl 文件为 "q-bench2-a1-test_(YOUR_MLLM_NAME).jsonl"，结构与 "q-bench2-a1-dev.jsonl" 相同
Description-compare 任务 (a2): 完成 "q-bench2-a2.jsonl" 文件的空 "response"，并重命名为 "q-bench2-a2_(YOUR_MLLM_NAME).jsonl"

联系信息

Zicheng Zhang, zzc1998@sjtu.edu.cn
Haoning Wu, haoning001@e.ntu.edu.sg

5,000+

优质数据集

54 个

任务类型

进入经典数据集