five

K-VQG

收藏
arXiv2025-09-30 收录
下载链接:
https://uehara-mech.github.io/kvqg
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大型的、由人类标注的知识感知视觉问答(VQG)数据集,其中基于图像的问题与结构化知识(知识三元组)相关联。每个样本包括一个图像、一个问题、一个答案以及一个知识三元组。该数据集大约包含13,000张图像和16,000对(问题、答案)组合,涉及6,000个知识三元组,旨在用于视觉问题生成任务。

This dataset is a large-scale, human-annotated knowledge-aware Visual Question Generation (VQG) dataset, where image-grounded questions are associated with structured knowledge (knowledge triples). Each sample comprises an image, a question, an answer, and a knowledge triple. The dataset contains approximately 13,000 images, 16,000 (question, answer) pairs, and 6,000 knowledge triples, and is intended for visual question generation tasks.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
K-VQG是一个用于常识获取的知识感知视觉问题生成数据集,由人类标注,将图像相关问题与结构化知识关联,包含超过16,000个问题。该数据集旨在从知识获取角度改进VQG任务,并提供了一个新模型,在实验中优于现有方法,适用于计算机视觉和自然语言处理研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作