KNVQA
收藏arXiv2023-11-21 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2311.12639v1
下载链接
链接失效反馈官方服务:
资源简介:
KNVQA数据集是由同济大学计算机科学与技术系创建,专注于知识基础的视觉问答任务。该数据集包含1500条记录,主要来源于OK-VQA和FVQA两个公共数据集。创建过程中,通过人工标注确保了数据的准确性和可靠性。KNVQA数据集的应用领域主要集中在评估和优化大型视觉语言模型在视觉问答任务中的表现,旨在提高模型的实际应用能力和解决复杂问题的能力。
提供机构:
同济大学计算机科学与技术系
创建时间:
2023-11-21
搜集汇总
数据集介绍

背景与挑战
背景概述
KNVQA数据集由同济大学计算机科学与技术系创建,专注于知识基础的视觉问答任务,包含1500条记录,主要来源于OK-VQA和FVQA两个公共数据集,并通过人工标注确保数据质量。该数据集旨在评估和优化大型视觉语言模型在视觉问答任务中的表现,以提升模型的实际应用和解决复杂问题的能力。
以上内容由遇见数据集搜集并总结生成



