Multimodal-Fatima/VQAv2_test
收藏数据集概述
数据集名称
VQAv2_test
数据集特征
-
问题类型 (
question_type)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
-
多选答案 (
multiple_choice_answer)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
-
原始答案 (
answers_original)- 包含以下子特征:
- 答案 (
answer)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 答案置信度 (
answer_confidence)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 答案ID (
answer_id)- 数据类型: 整数 (
int64)
- 数据类型: 整数 (
- 答案 (
- 包含以下子特征:
-
图像ID (
id_image)- 数据类型: 整数 (
int64)
- 数据类型: 整数 (
-
答案类型 (
answer_type)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
-
问题ID (
question_id)- 数据类型: 整数 (
int64)
- 数据类型: 整数 (
-
问题文本 (
question)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
-
图像 (
image)- 数据类型: 图像 (
image)
- 数据类型: 图像 (
-
通用ID (
id)- 数据类型: 整数 (
int64)
- 数据类型: 整数 (
-
剪辑标签ViT L 14 (
clip_tags_ViT_L_14)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
BLIP标题 (
blip_caption)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
-
LLM描述 (
LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
DETA检测 (
DETA_detections_deta_swin_large_o365_coco_classes)- 包含以下子特征:
- 属性 (
attribute)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 边界框 (
box)- 数据类型: 序列浮点数 (
sequence: float32)
- 数据类型: 序列浮点数 (
- 标签 (
label)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 位置 (
location)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 比例 (
ratio)- 数据类型: 浮点数 (
float32)
- 数据类型: 浮点数 (
- 大小 (
size)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 标签 (
tag)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 属性 (
- 包含以下子特征:
-
属性描述 (
Attributes_ViT_L_14_descriptors_text_davinci_003_full)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
剪辑标签ViT L 14(无OpenAI) (
clip_tags_ViT_L_14_wo_openai)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
剪辑标签ViT L 14(含OpenAI) (
clip_tags_ViT_L_14_with_openai)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
剪辑标签LAION ViT H 14 2B(无OpenAI) (
clip_tags_LAION_ViT_H_14_2B_wo_openai)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
剪辑标签LAION ViT H 14 2B(含OpenAI) (
clip_tags_LAION_ViT_H_14_2B_with_openai)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
剪辑标签LAION ViT bigG 14 2B(无OpenAI) (
clip_tags_LAION_ViT_bigG_14_2B_wo_openai)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
剪辑标签LAION ViT bigG 14 2B(含OpenAI) (
clip_tags_LAION_ViT_bigG_14_2B_with_openai)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
LAION ViT H 14 2B属性描述 (
Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
LAION ViT bigG 14 2B属性描述 (
Attributes_LAION_ViT_bigG_14_2B_descriptors_text_davinci_003_full)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
剪辑标签ViT B 16(含OpenAI) (
clip_tags_ViT_B_16_with_openai)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
-
DETA检测(随机标题模块) (
DETA_detections_deta_swin_large_o365_coco_classes_caption_module_random)- 包含以下子特征:
- 属性 (
attribute)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 边界框 (
box)- 数据类型: 序列浮点数 (
sequence: float64)
- 数据类型: 序列浮点数 (
- 标题模块 (
captions_module)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
- 标题模块过滤器 (
captions_module_filter)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
- 标签 (
label)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 位置 (
location)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 比例 (
ratio)- 数据类型: 浮点数 (
float64)
- 数据类型: 浮点数 (
- 大小 (
size)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 标签 (
tag)- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 属性 (
- 包含以下子特征:
-
答案 (
answers)- 数据类型: 序列字符串 (
sequence: string)
- 数据类型: 序列字符串 (
数据集分割
- 测试集 (
test)- 字节数: 92151870512.0
- 示例数: 447793
数据集大小
- 下载大小: 18737258554
- 数据集大小: 92151870512.0



