SIS-2024-spring/coco_vqa_small_dataset

Name: SIS-2024-spring/coco_vqa_small_dataset
Creator: SIS-2024-spring
Published: 2024-05-16 06:47:53
License: 暂无描述

Hugging Face2024-05-16 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/SIS-2024-spring/coco_vqa_small_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

视觉问答（VQA）数据集是一个包含关于图像的开放式问题的数据集。这些问题需要理解视觉、语言和常识知识来回答。数据集从Graphcore的VQA验证数据集中分割出小训练集和小验证集。每个数据点包括一张图像及其对象注释。数据字段包括问题、问题类型、图像ID、答案类型和标签等。数据集分为训练数据集（1169个样本）和验证数据集（100个样本）。

提供机构：

SIS-2024-spring

原始信息汇总

数据集概述

数据集名称: Vision question Answer (VQA) dataset
描述: VQA是一个包含关于图像的开放式问题的新数据集。这些问题需要对视觉、语言和常识知识的理解来回答。
参考: 从https://huggingface.co/datasets/Graphcore/vqa验证数据集中分割成小训练集和小验证集。

数据集结构

数据实例

每个数据点包含一个图像及其对象注释。

示例数据点: json { "question": "Where is he looking?", "question_type": "none of the above", "question_id": 262148000, "image_id": "images/COCO_val2014_000000262148.jpg", "answer_type": "other", "label": { "ids": ["at table", "down", "skateboard", "table"], "weights": [0.30000001192092896, 1.0, 0.30000001192092896, 0.30000001192092896] } }

数据字段

question: 需要从图像中回答的问题
question_type: 问题类型
image_id: 问题所指图像的路径
answer_type: 答案类型
label: 注释
- ids: 注释的ID
- weights: 注释的权重

数据分割

训练数据集: 1169个样本
验证数据集: 100个样本

使用方法

python from datasets import load_dataset dataset = load_dataset("SIS-2024-spring/coco_vqa_small_dataset")

5,000+

优质数据集

54 个

任务类型

进入经典数据集