five

ViCLEVR

收藏
arXiv2023-10-27 更新2024-07-31 收录
下载链接:
https://github.com/kvt0012/ViCLEVR
下载链接
链接失效反馈
官方服务:
资源简介:
一个用于评估越南语视觉推理能力的开创性数据集,包含超过26,000张图像和30,000个问题-答案对,每个问题都标注了涉及的推理类型。

A pioneering dataset for evaluating Vietnamese visual reasoning capabilities, comprising over 26,000 images and 30,000 question-answer pairs, with each question annotated with the corresponding type of reasoning.
创建时间:
2023-10-27
原始信息汇总

ViCLEVR: A Visual Reasoning Dataset and Hybrid Multimodal Fusion Model for Visual Question Answering in Vietnamese

数据集概述

  • 名称: ViCLEVR
  • 类型: 视觉推理数据集
  • 语言: 越南语
  • 位置: 数据集位于仓库的 data/ViCLEVR 文件夹中

数据格式

数据集包含以下字段:

  • id: 数据条目ID
  • question: 问题列表,包含不同语言的表述和关键词
    • language: 语言类型(如 en 表示英语,vi 表示越南语)
    • string: 问题文本
    • keywords: 问题关键词
  • query: 查询语句,通常为SPARQL格式
  • answers: 答案列表,包含答案的详细信息

引用

@Article{Tran2023ViCLEVR, title= {ViCLEVR: a visual reasoning dataset and hybrid multimodal fusion model for visual question answering in Vietnamese}, author= {Khiem Vinh Tran, Hao Phu Phan, Kiet Van Nguyen, Ngan Luu Thuy Nguyen}, journal= {Multimedia Systems}, number= {4}, pages= {199}, doi= {10.1007/s00530-024-01394-w}, year={2024} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作