five

SIS-2024-spring/coco_vqa_small_dataset

收藏
Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/SIS-2024-spring/coco_vqa_small_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
视觉问答(VQA)数据集是一个包含关于图像的开放式问题的数据集。这些问题需要理解视觉、语言和常识知识来回答。数据集从Graphcore的VQA验证数据集中分割出小训练集和小验证集。每个数据点包括一张图像及其对象注释。数据字段包括问题、问题类型、图像ID、答案类型和标签等。数据集分为训练数据集(1169个样本)和验证数据集(100个样本)。

视觉问答(VQA)数据集是一个包含关于图像的开放式问题的数据集。这些问题需要理解视觉、语言和常识知识来回答。数据集从Graphcore的VQA验证数据集中分割出小训练集和小验证集。每个数据点包括一张图像及其对象注释。数据字段包括问题、问题类型、图像ID、答案类型和标签等。数据集分为训练数据集(1169个样本)和验证数据集(100个样本)。
提供机构:
SIS-2024-spring
原始信息汇总

数据集概述

  • 数据集名称: Vision question Answer (VQA) dataset
  • 描述: VQA是一个包含关于图像的开放式问题的新数据集。这些问题需要对视觉、语言和常识知识的理解来回答。
  • 参考: 从https://huggingface.co/datasets/Graphcore/vqa验证数据集中分割成小训练集和小验证集。

数据集结构

数据实例

每个数据点包含一个图像及其对象注释。

示例数据点: json { "question": "Where is he looking?", "question_type": "none of the above", "question_id": 262148000, "image_id": "images/COCO_val2014_000000262148.jpg", "answer_type": "other", "label": { "ids": ["at table", "down", "skateboard", "table"], "weights": [0.30000001192092896, 1.0, 0.30000001192092896, 0.30000001192092896] } }

数据字段

  • question: 需要从图像中回答的问题
  • question_type: 问题类型
  • image_id: 问题所指图像的路径
  • answer_type: 答案类型
  • label: 注释
    • ids: 注释的ID
    • weights: 注释的权重

数据分割

  • 训练数据集: 1169个样本
  • 验证数据集: 100个样本

使用方法

python from datasets import load_dataset dataset = load_dataset("SIS-2024-spring/coco_vqa_small_dataset")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作