ChiJuiChen/coco_vqa_small_dataset
收藏Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ChiJuiChen/coco_vqa_small_dataset
下载链接
链接失效反馈官方服务:
资源简介:
VQA(视觉问答)数据集包含关于图像的开放式问题,这些问题需要视觉、语言和常识知识来回答。数据集是从Graphcore/vqa验证数据集中分割出来的小训练集和小验证集。每个数据点包括一个图像及其对象注释,数据字段包括问题、问题类型、图像ID、答案类型和标签。数据集分为训练集和验证集,分别包含1169和100个数据点。
VQA(视觉问答)数据集包含关于图像的开放式问题,这些问题需要视觉、语言和常识知识来回答。数据集是从Graphcore/vqa验证数据集中分割出来的小训练集和小验证集。每个数据点包括一个图像及其对象注释,数据字段包括问题、问题类型、图像ID、答案类型和标签。数据集分为训练集和验证集,分别包含1169和100个数据点。
提供机构:
ChiJuiChen
原始信息汇总
数据集概述
数据集名称
- Vision Question Answer (VQA) 数据集
数据集描述
- VQA 数据集包含关于图像的开放式问题,这些问题需要视觉、语言和常识知识的理解来回答。
- 该数据集是从 https://huggingface.co/datasets/Graphcore/vqa 验证数据集中分割出的小型训练和验证数据集。
数据集结构
数据实例
- 每个数据点包括一个图像及其对象标注。
数据字段
question: 图像相关的问题question_type: 未指定image_id: 图像文件的路径answer_type: 未指定label: 标注信息ids: 标注的类别weights: 类别权重
数据分割
Training dataset: 包含1169个样本Val dataset: 包含100个样本
数据集使用示例
python from datasets import load_dataset dataset = load_dataset("SIS-2024-spring/coco_vqa_small_dataset")



