uwwee/coco_vqa_small_dataset
收藏Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/uwwee/coco_vqa_small_dataset
下载链接
链接失效反馈官方服务:
资源简介:
视觉问答(VQA)数据集是一个包含关于图像的开放式问题的新数据集。这些问题需要视觉、语言和常识知识来回答。该数据集是从Hugging Face的Graphcore/vqa验证数据集中分割出来的小训练集和小验证集。每个数据点包括一个图像及其对象注释,具体包含问题、问题类型、图像ID、答案类型和标签。标签部分进一步细分为ID和权重。数据集分为训练数据集(1169个样本)和验证数据集(100个样本)。
视觉问答(VQA)数据集是一个包含关于图像的开放式问题的新数据集。这些问题需要视觉、语言和常识知识来回答。该数据集是从Hugging Face的Graphcore/vqa验证数据集中分割出来的小训练集和小验证集。每个数据点包括一个图像及其对象注释,具体包含问题、问题类型、图像ID、答案类型和标签。标签部分进一步细分为ID和权重。数据集分为训练数据集(1169个样本)和验证数据集(100个样本)。
提供机构:
uwwee
原始信息汇总
数据集概述
数据集名称
- Vision question Answer (VQA) dataset
数据集描述
- 包含关于图像的开放式问题,需要视觉、语言和常识知识来回答。
- 从Graphcore/vqa验证数据集中分割出的小型训练和验证数据集。
数据集结构
数据实例
- 每个数据点包含一张图像及其对象标注。
数据字段
question: 图像相关的问题question_type: 问题类型image_id: 图像文件路径answer_type: 答案类型label: 标注信息ids: 标注的类别weights: 类别权重
数据分割
Training dataset: 1169个样本Val dataset: 100个样本
数据集使用
- 通过
datasets库加载数据集,使用命令:load_dataset("SIS-2024-spring/coco_vqa_small_dataset")



