K-VQG

arXiv2025-09-30 收录

下载链接：

https://uehara-mech.github.io/kvqg

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个大型的、由人类标注的知识感知视觉问答（VQG）数据集，其中基于图像的问题与结构化知识（知识三元组）相关联。每个样本包括一个图像、一个问题、一个答案以及一个知识三元组。该数据集大约包含13,000张图像和16,000对（问题、答案）组合，涉及6,000个知识三元组，旨在用于视觉问题生成任务。

This dataset is a large-scale, human-annotated knowledge-aware Visual Question Generation (VQG) dataset, where image-grounded questions are associated with structured knowledge (knowledge triples). Each sample comprises an image, a question, an answer, and a knowledge triple. The dataset contains approximately 13,000 images, 16,000 (question, answer) pairs, and 6,000 knowledge triples, and is intended for visual question generation tasks.

搜集汇总

数据集介绍

背景与挑战

背景概述

K-VQG是一个用于常识获取的知识感知视觉问题生成数据集，由人类标注，将图像相关问题与结构化知识关联，包含超过16,000个问题。该数据集旨在从知识获取角度改进VQG任务，并提供了一个新模型，在实验中优于现有方法，适用于计算机视觉和自然语言处理研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集