five

vikhyatk/gqa

收藏
Hugging Face2024-07-02 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/vikhyatk/gqa
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要包含图像和问答信息。图像部分是图像数据类型,问答部分包含问题、答案和完整答案,均为字符串类型。数据集分为训练集和验证集,分别有72140和10234个样本。总下载大小为11650910411字节,总数据集大小为11601721115.52字节。数据集配置为默认,数据文件路径指向训练和验证集的文件。

The dataset primarily consists of image and question-answer information. The image part is of image data type, and the question-answer part includes question, answer, and full answer, all of which are string types. The dataset is divided into a training set and a validation set, with 72140 and 10234 samples respectively. The total download size is 11650910411 bytes, and the total dataset size is 11601721115.52 bytes. The dataset configuration is default, with data file paths pointing to the training and validation set files.
提供机构:
vikhyatk
原始信息汇总

数据集概述

数据特征

  • image: 图像数据
  • qa: 问题与答案数据
    • question: 问题,字符串类型
    • answer: 答案,字符串类型
    • fullAnswer: 完整答案,字符串类型

数据集划分

  • train_balanced: 训练集
    • 样本数量: 72140
    • 数据大小: 10172551012.98 字节
  • val_balanced: 验证集
    • 样本数量: 10234
    • 数据大小: 1429170102.54 字节

数据集大小

  • 下载大小: 11650910411 字节
  • 数据集总大小: 11601721115.52 字节

配置

  • default: 默认配置
    • 数据文件路径:
      • 训练集: data/train_balanced-*
      • 验证集: data/val_balanced-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作