Multimodal-Fatima/VQAv2_minival_validation_vprevious
收藏数据集概述
数据集名称
"VQA_minival_validation"
数据集特征
-
问题类型 (
question_type)- 数据类型: 字符串
-
多选答案 (
multiple_choice_answer)- 数据类型: 字符串
-
答案 (
answers)- 数据类型: 字符串序列
-
原始答案 (
answers_original)- 数据类型: 列表
- 答案 (
answer)- 数据类型: 字符串
- 答案置信度 (
answer_confidence)- 数据类型: 字符串
- 答案ID (
answer_id)- 数据类型: int64
- 答案 (
- 数据类型: 列表
-
图像ID (
id_image)- 数据类型: int64
-
答案类型 (
answer_type)- 数据类型: 字符串
-
问题ID (
question_id)- 数据类型: int64
-
问题 (
question)- 数据类型: 字符串
-
图像 (
image)- 数据类型: 图像
-
Clip标签 (
clip_tags_ViT_L_14)- 数据类型: 字符串序列
-
Blip标题 (
blip_caption)- 数据类型: 字符串
-
LLM描述 (
LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14)- 数据类型: 字符串序列
-
DETA检测 (
DETA_detections_deta_swin_large_o365_coco_classes)- 数据类型: 列表
- 属性 (
attribute)- 数据类型: 字符串
- 框 (
box)- 数据类型: float32序列
- 标签 (
label)- 数据类型: 字符串
- 位置 (
location)- 数据类型: 字符串
- 比率 (
ratio)- 数据类型: float32
- 大小 (
size)- 数据类型: 字符串
- 标签 (
tag)- 数据类型: 字符串
- 属性 (
- 数据类型: 列表
-
DETA检测 (
DETA_detections_deta_swin_large_o365_clip_ViT_L_14)- 数据类型: 列表
- 属性 (
attribute)- 数据类型: 字符串
- 框 (
box)- 数据类型: float64序列
- 标签 (
label)- 数据类型: 字符串
- 位置 (
location)- 数据类型: 字符串
- 比率 (
ratio)- 数据类型: float64
- 大小 (
size)- 数据类型: 字符串
- 标签 (
tag)- 数据类型: 字符串
- 属性 (
- 数据类型: 列表
-
DETA检测 (
DETA_detections_deta_swin_large_o365_clip_ViT_L_14_blip_caption)- 数据类型: 列表
- 属性 (
attribute)- 数据类型: 字符串
- 框 (
box)- 数据类型: float64序列
- 标题 (
caption)- 数据类型: 字符串
- 标签 (
label)- 数据类型: 字符串
- 位置 (
location)- 数据类型: 字符串
- 比率 (
ratio)- 数据类型: float64
- 大小 (
size)- 数据类型: 字符串
- 标签 (
tag)- 数据类型: 字符串
- 属性 (
- 数据类型: 列表
-
DETA检测 (
DETA_detections_deta_swin_large_o365_clip_ViT_L_14_blip_caption_caption_module)- 数据类型: 列表
- 属性 (
attribute)- 数据类型: 字符串
- 框 (
box)- 数据类型: float64序列
- 标题 (
caption)- 数据类型: 字符串
- 标题模块 (
captions_module)- 数据类型: 字符串序列
- 标签 (
label)- 数据类型: 字符串
- 位置 (
location)- 数据类型: 字符串
- 比率 (
ratio)- 数据类型: float64
- 大小 (
size)- 数据类型: 字符串
- 标签 (
tag)- 数据类型: 字符串
- 属性 (
- 数据类型: 列表
-
DETA检测 (
DETA_detections_deta_swin_large_o365_clip_ViT_L_14_blip_caption_caption_module_without_filtering)- 数据类型: 列表
- 属性 (
attribute)- 数据类型: 字符串
- 框 (
box)- 数据类型: float64序列
- 标题 (
caption)- 数据类型: 字符串
- 标题模块 (
captions_module)- 数据类型: 字符串序列
- 标签 (
label)- 数据类型: 字符串
- 位置 (
location)- 数据类型: 字符串
- 比率 (
ratio)- 数据类型: float64
- 大小 (
size)- 数据类型: 字符串
- 标签 (
tag)- 数据类型: 字符串
- 属性 (
- 数据类型: 列表
-
DETA检测 (
DETA_detections_deta_swin_large_o365_clip_ViT_L_14_blip_caption_caption_module_random)- 数据类型: 列表
- 属性 (
attribute)- 数据类型: 字符串
- 框 (
box)- 数据类型: float64序列
- 标题 (
caption)- 数据类型: 字符串
- 标题模块 (
captions_module)- 数据类型: 字符串序列
- 标题模块过滤 (
captions_module_filter)- 数据类型: 字符串序列
- 标签 (
label)- 数据类型: 字符串
- 位置 (
location)- 数据类型: 字符串
- 比率 (
ratio)- 数据类型: float64
- 大小 (
size)- 数据类型: 字符串
- 标签 (
tag)- 数据类型: 字符串
- 属性 (
- 数据类型: 列表
-
Clip标签 (
clip_tags_LAION_ViT_H_14_2B)- 数据类型: 字符串序列
-
LLM描述 (
LLM_Description_gpt3_downstream_tasks_visual_genome_LAION-ViT-H-14-2B)- 数据类型: 字符串序列
-
属性 (
Attributes_ViT_L_14_descriptors_text_davinci_003_full)- 数据类型: 字符串序列
-
Clip标签 (
clip_tags_ViT_L_14_wo_openai)- 数据类型: 字符串序列
-
Clip标签 (
clip_tags_ViT_L_14_with_openai)- 数据类型: 字符串序列
-
Clip标签 (
clip_tags_LAION_ViT_H_14_2B_wo_openai)- 数据类型: 字符串序列
-
Clip标签 (
clip_tags_LAION_ViT_H_14_2B_with_openai)- 数据类型: 字符串序列
-
Clip标签 (
clip_tags_LAION_ViT_bigG_14_2B_wo_openai)- 数据类型: 字符串序列
-
Clip标签 (
clip_tags_LAION_ViT_bigG_14_2B_with_openai)- 数据类型: 字符串序列
-
属性 (
Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full)- 数据类型: 字符串序列
-
属性 (
Attributes_LAION_ViT_bigG_14_2B_descriptors_text_davinci_003_full)- 数据类型: 字符串序列
-
Clip标签 (
clip_tags_ViT_B_16_with_openai)- 数据类型: 字符串序列
-
Blip标题 (
blip_caption_beam_5_Salesforce_blip2_flan_t5_xxl)- 数据类型: 字符串
-
DETA检测 (
DETA_detections_deta_swin_large_o365_coco_classes_caption_all_patches_Salesforce_blip_image_captioning_large)- 数据类型: 列表
- 属性 (
attribute)- 数据类型: 字符串
- 框 (
box)- 数据类型: float64序列
- 所有补丁标题 (
captions_all_patches)- 数据类型: 字符串序列
- 标签 (
label)- 数据类型: 字符串
- 位置 (
location)- 数据类型: 字符串
- 比率 (
ratio)- 数据类型: float64
- 大小 (
size)- 数据类型: 字符串
- 标签 (
tag)- 数据类型: 字符串
- 属性 (
- 数据类型: 列表
-
DETA检测 (
DETA_detections_deta_swin_large_o365_coco_classes_caption_all_patches_Salesforce_blip_image_captioning_large_clean)- 数据类型: 列表
- 属性 (
attribute)- 数据类型: 字符串
- 框 (
box)- 数据类型: float64序列
- 所有补丁标题 (
captions_all_patches)- 数据类型: 字符串序列
- 标签 (
label)- 数据类型: 字符串
- 位置 (
location)- 数据类型: 字符串
- 比率 (
ratio)- 数据类型: float64
- 大小 (
size)- 数据类型: 字符串
- 标签 (
tag)- 数据类型: 字符串
- 属性 (
- 数据类型: 列表
数据集分割
- 验证集 (
validation)- 字节数: 10522752337.0
- 示例数: 25994
数据集大小
- 下载大小: 2699481376
- 数据集大小: 10522752337.0



