five

uwwee/coco_vqa_small_dataset

收藏
Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/uwwee/coco_vqa_small_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
视觉问答(VQA)数据集是一个包含关于图像的开放式问题的新数据集。这些问题需要视觉、语言和常识知识来回答。该数据集是从Hugging Face的Graphcore/vqa验证数据集中分割出来的小训练集和小验证集。每个数据点包括一个图像及其对象注释,具体包含问题、问题类型、图像ID、答案类型和标签。标签部分进一步细分为ID和权重。数据集分为训练数据集(1169个样本)和验证数据集(100个样本)。

视觉问答(VQA)数据集是一个包含关于图像的开放式问题的新数据集。这些问题需要视觉、语言和常识知识来回答。该数据集是从Hugging Face的Graphcore/vqa验证数据集中分割出来的小训练集和小验证集。每个数据点包括一个图像及其对象注释,具体包含问题、问题类型、图像ID、答案类型和标签。标签部分进一步细分为ID和权重。数据集分为训练数据集(1169个样本)和验证数据集(100个样本)。
提供机构:
uwwee
原始信息汇总

数据集概述

数据集名称

  • Vision question Answer (VQA) dataset

数据集描述

  • 包含关于图像的开放式问题,需要视觉、语言和常识知识来回答。
  • 从Graphcore/vqa验证数据集中分割出的小型训练和验证数据集。

数据集结构

数据实例

  • 每个数据点包含一张图像及其对象标注。

数据字段

  • question: 图像相关的问题
  • question_type: 问题类型
  • image_id: 图像文件路径
  • answer_type: 答案类型
  • label: 标注信息
    • ids: 标注的类别
    • weights: 类别权重

数据分割

  • Training dataset: 1169个样本
  • Val dataset: 100个样本

数据集使用

  • 通过datasets库加载数据集,使用命令:load_dataset("SIS-2024-spring/coco_vqa_small_dataset")
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作