SIS-2024-spring/coco_vqa_small_dataset
收藏Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/SIS-2024-spring/coco_vqa_small_dataset
下载链接
链接失效反馈官方服务:
资源简介:
视觉问答(VQA)数据集是一个包含关于图像的开放式问题的数据集。这些问题需要理解视觉、语言和常识知识来回答。数据集从Graphcore的VQA验证数据集中分割出小训练集和小验证集。每个数据点包括一张图像及其对象注释。数据字段包括问题、问题类型、图像ID、答案类型和标签等。数据集分为训练数据集(1169个样本)和验证数据集(100个样本)。
视觉问答(VQA)数据集是一个包含关于图像的开放式问题的数据集。这些问题需要理解视觉、语言和常识知识来回答。数据集从Graphcore的VQA验证数据集中分割出小训练集和小验证集。每个数据点包括一张图像及其对象注释。数据字段包括问题、问题类型、图像ID、答案类型和标签等。数据集分为训练数据集(1169个样本)和验证数据集(100个样本)。
提供机构:
SIS-2024-spring
原始信息汇总
数据集概述
- 数据集名称: Vision question Answer (VQA) dataset
- 描述: VQA是一个包含关于图像的开放式问题的新数据集。这些问题需要对视觉、语言和常识知识的理解来回答。
- 参考: 从https://huggingface.co/datasets/Graphcore/vqa验证数据集中分割成小训练集和小验证集。
数据集结构
数据实例
每个数据点包含一个图像及其对象注释。
示例数据点: json { "question": "Where is he looking?", "question_type": "none of the above", "question_id": 262148000, "image_id": "images/COCO_val2014_000000262148.jpg", "answer_type": "other", "label": { "ids": ["at table", "down", "skateboard", "table"], "weights": [0.30000001192092896, 1.0, 0.30000001192092896, 0.30000001192092896] } }
数据字段
question: 需要从图像中回答的问题question_type: 问题类型image_id: 问题所指图像的路径answer_type: 答案类型label: 注释ids: 注释的IDweights: 注释的权重
数据分割
- 训练数据集: 1169个样本
- 验证数据集: 100个样本
使用方法
python from datasets import load_dataset dataset = load_dataset("SIS-2024-spring/coco_vqa_small_dataset")



