five

q-future/q-bench2

收藏
Hugging Face2024-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/q-future/q-bench2
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集是针对低级视觉多模态基础模型的基准测试集,涵盖从单张图像到成对图像的任务。数据集包含多个jsonl文件,每个文件包含图像路径、问题、候选答案和正确答案(或空响应)。图像路径由前缀、两张图像名和_cat_连接组成。数据集还提供了所有单张图像和拼接图像的存储结构,并指导用户如何提交自己的多模态语言和语言模型(MLLM)进行测试。

本数据集是针对低级视觉多模态基础模型的基准测试集,涵盖从单张图像到成对图像的任务。数据集包含多个jsonl文件,每个文件包含图像路径、问题、候选答案和正确答案(或空响应)。图像路径由前缀、两张图像名和_cat_连接组成。数据集还提供了所有单张图像和拼接图像的存储结构,并指导用户如何提交自己的多模态语言和语言模型(MLLM)进行测试。
提供机构:
q-future
原始信息汇总

数据集概述

数据集名称

  • A Benchmark for Multi-modal Foundation Models on Low-level Vision: from Single Images to Pairs

数据集结构

  • q-bench2-a1-dev.jsonl: 包含 img_path, question, answer_candidates, correct_answer
  • q-bench2-a1-test.jsonl: 包含 img_path, question, answer_candidates, 不包含 correct_answer
  • q-bench2-a2.jsonl: 包含 img_path, empty response

图像路径组织

  • 图像路径格式为 prefix + img1 + _cat_ + img2 + .jpg
  • 示例:img_path 为 "llvisionqa_compare_dev\00079.jpg_cat_09769.jpg.jpg",则 prefix 为 "llvisionqa_compare_dev",img1 为 "00079.jpg",img2 为 "09769.jpg"

图像文件结构

  • all_single_images: 所有单张图像
  • llvisionqa_compare_dev: perception-compare 任务的 dev 子集的拼接图像
  • llvisionqa_compare_test: perception-compare 任务的 test 子集的拼接图像
  • lldescribe_compare: description-compare 任务的拼接图像

提交格式

  • Perception-compare 任务 (a1): 组织 jsonl 文件为 "q-bench2-a1-test_(YOUR_MLLM_NAME).jsonl",结构与 "q-bench2-a1-dev.jsonl" 相同
  • Description-compare 任务 (a2): 完成 "q-bench2-a2.jsonl" 文件的空 "response",并重命名为 "q-bench2-a2_(YOUR_MLLM_NAME).jsonl"

联系信息

  • Zicheng Zhang, zzc1998@sjtu.edu.cn
  • Haoning Wu, haoning001@e.ntu.edu.sg
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作