five

ReadingTimeMachine/visual_qa_multipanel

收藏
Hugging Face2025-09-19 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/ReadingTimeMachine/visual_qa_multipanel
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于测试大型语言/多模态模型(LMMs)的多面板视觉问答(VQA)数据集。数据集包含了合成的多面板图形以及与之相关的问答对。图形从易于人类/LMMs解析到因数据标记重叠而非常棘手的都有。

This is a multi-panel visual question and answer (VQA) dataset for testing large language/multimodal models (LMMs). The dataset contains synthetically generated figures along with associated question-answer pairs. The figures range from easy to decipher by humans/LMMs to very tricky due to overlapping data marks.
提供机构:
ReadingTimeMachine
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作