ViCLEVR

arXiv2023-10-27 更新2024-07-31 收录

下载链接：

https://github.com/kvt0012/ViCLEVR

下载链接

链接失效反馈

官方服务：

资源简介：

一个用于评估越南语视觉推理能力的开创性数据集，包含超过26,000张图像和30,000个问题-答案对，每个问题都标注了涉及的推理类型。

A pioneering dataset for evaluating Vietnamese visual reasoning capabilities, comprising over 26,000 images and 30,000 question-answer pairs, with each question annotated with the corresponding type of reasoning.

创建时间：

2023-10-27

原始信息汇总

ViCLEVR: A Visual Reasoning Dataset and Hybrid Multimodal Fusion Model for Visual Question Answering in Vietnamese

数据集概述

名称: ViCLEVR
类型: 视觉推理数据集
语言: 越南语
位置: 数据集位于仓库的 data/ViCLEVR 文件夹中

数据格式

数据集包含以下字段：

id: 数据条目ID
question: 问题列表，包含不同语言的表述和关键词
- language: 语言类型（如 en 表示英语，vi 表示越南语）
- string: 问题文本
- keywords: 问题关键词
query: 查询语句，通常为SPARQL格式
answers: 答案列表，包含答案的详细信息

引用

@Article{Tran2023ViCLEVR, title= {ViCLEVR: a visual reasoning dataset and hybrid multimodal fusion model for visual question answering in Vietnamese}, author= {Khiem Vinh Tran, Hao Phu Phan, Kiet Van Nguyen, Ngan Luu Thuy Nguyen}, journal= {Multimedia Systems}, number= {4}, pages= {199}, doi= {10.1007/s00530-024-01394-w}, year={2024} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集