five

Multimodal-Fatima/VQAv2_test_no_image_split_0

收藏
Hugging Face2023-05-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Multimodal-Fatima/VQAv2_test_no_image_split_0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个视觉问答(VQA)数据集,包含与图像相关的问题和答案。数据集的特征包括问题类型、多项选择答案、答案列表、图像ID、问题ID、问题文本、CLIP标签、BLIP标题、LLM描述、DETA检测等。数据集还包含一个测试集,大小为2406349850字节,包含44780个示例。下载大小为651260802字节。

该数据集是一个视觉问答(VQA)数据集,包含与图像相关的问题和答案。数据集的特征包括问题类型、多项选择答案、答案列表、图像ID、问题ID、问题文本、CLIP标签、BLIP标题、LLM描述、DETA检测等。数据集还包含一个测试集,大小为2406349850字节,包含44780个示例。下载大小为651260802字节。
提供机构:
Multimodal-Fatima
原始信息汇总

数据集概述

数据集名称

VQAv2_test_no_image_split_0

数据集特征

基本特征

  • question_type: 字符串类型
  • multiple_choice_answer: 字符串类型
  • answers: 字符串序列类型
  • answers_original: 列表类型,包含以下子特征:
    • answer: 字符串类型
    • answer_confidence: 字符串类型
    • answer_id: 整数类型(64位)
  • id_image: 整数类型(64位)
  • answer_type: 字符串类型
  • question_id: 整数类型(64位)
  • question: 字符串类型
  • id: 整数类型(64位)
  • clip_tags_ViT_L_14: 字符串序列类型
  • blip_caption: 字符串类型
  • LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14: 字符串序列类型

检测特征

  • DETA_detections_deta_swin_large_o365_coco_classes: 列表类型,包含以下子特征:
    • attribute: 字符串类型
    • box: 浮点序列类型(32位)
    • label: 字符串类型
    • location: 字符串类型
    • ratio: 浮点类型(32位)
    • size: 字符串类型
    • tag: 字符串类型

描述特征

  • Attributes_ViT_L_14_descriptors_text_davinci_003_full: 字符串序列类型
  • clip_tags_ViT_L_14_wo_openai: 字符串序列类型
  • clip_tags_ViT_L_14_with_openai: 字符串序列类型
  • clip_tags_LAION_ViT_H_14_2B_wo_openai: 字符串序列类型
  • clip_tags_LAION_ViT_H_14_2B_with_openai: 字符串序列类型
  • clip_tags_LAION_ViT_bigG_14_2B_wo_openai: 字符串序列类型
  • clip_tags_LAION_ViT_bigG_14_2B_with_openai: 字符串序列类型
  • Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full: 字符串序列类型
  • Attributes_LAION_ViT_bigG_14_2B_descriptors_text_davinci_003_full: 字符串序列类型

随机模块特征

  • DETA_detections_deta_swin_large_o365_coco_classes_caption_module_random: 列表类型,包含以下子特征:
    • attribute: 字符串类型
    • box: 浮点序列类型(64位)
    • captions_module: 字符串序列类型
    • captions_module_filter: 字符串序列类型
    • label: 字符串类型
    • location: 字符串类型
    • ratio: 浮点类型(64位)
    • size: 字符串类型
    • tag: 字符串类型

数据集分割

  • test: 包含44780个样本,数据量大小为2406349850字节。

数据集大小

  • 下载大小: 651260802字节
  • 数据集大小: 2406349850字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作