five

InfoSeek

收藏
arXiv2025-09-30 收录
下载链接:
https://open-vision-language.github.io/infoseek/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专为那些不能仅凭常识知识回答的信息寻求类问题而设计,是一个视觉问答数据集。它突显了模型在回答视觉信息寻求问题时所面临的挑战,并展示了通过微调可以从预训练模型中引出知识。该数据集的任务是视觉问答。

This is a visual question answering (VQA) dataset designed specifically for information-seeking questions that cannot be answered solely based on common sense knowledge. It highlights the challenges models encounter when addressing visual information-seeking queries, and demonstrates that knowledge can be elicited from pre-trained models via fine-tuning. The task of this dataset is visual question answering.
提供机构:
Authors of the paper
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
InfoSeek是一个专注于视觉信息寻求问题的VQA数据集,包含人工标注的高质量问答对和自动构建的大规模数据,用于评估预训练视觉问答系统的性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作