ViCLEVR
收藏arXiv2023-10-27 更新2024-07-31 收录
下载链接:
https://github.com/kvt0012/ViCLEVR
下载链接
链接失效反馈官方服务:
资源简介:
一个用于评估越南语视觉推理能力的开创性数据集,包含超过26,000张图像和30,000个问题-答案对,每个问题都标注了涉及的推理类型。
A pioneering dataset for evaluating Vietnamese visual reasoning capabilities, comprising over 26,000 images and 30,000 question-answer pairs, with each question annotated with the corresponding type of reasoning.
创建时间:
2023-10-27
原始信息汇总
ViCLEVR: A Visual Reasoning Dataset and Hybrid Multimodal Fusion Model for Visual Question Answering in Vietnamese
数据集概述
- 名称: ViCLEVR
- 类型: 视觉推理数据集
- 语言: 越南语
- 位置: 数据集位于仓库的
data/ViCLEVR文件夹中
数据格式
数据集包含以下字段:
id: 数据条目IDquestion: 问题列表,包含不同语言的表述和关键词language: 语言类型(如en表示英语,vi表示越南语)string: 问题文本keywords: 问题关键词
query: 查询语句,通常为SPARQL格式answers: 答案列表,包含答案的详细信息
引用
@Article{Tran2023ViCLEVR, title= {ViCLEVR: a visual reasoning dataset and hybrid multimodal fusion model for visual question answering in Vietnamese}, author= {Khiem Vinh Tran, Hao Phu Phan, Kiet Van Nguyen, Ngan Luu Thuy Nguyen}, journal= {Multimedia Systems}, number= {4}, pages= {199}, doi= {10.1007/s00530-024-01394-w}, year={2024} }



