Multimodal-Fatima/VQAv2_test_no_image_split_0
收藏Hugging Face2023-05-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Multimodal-Fatima/VQAv2_test_no_image_split_0
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个视觉问答(VQA)数据集,包含与图像相关的问题和答案。数据集的特征包括问题类型、多项选择答案、答案列表、图像ID、问题ID、问题文本、CLIP标签、BLIP标题、LLM描述、DETA检测等。数据集还包含一个测试集,大小为2406349850字节,包含44780个示例。下载大小为651260802字节。
该数据集是一个视觉问答(VQA)数据集,包含与图像相关的问题和答案。数据集的特征包括问题类型、多项选择答案、答案列表、图像ID、问题ID、问题文本、CLIP标签、BLIP标题、LLM描述、DETA检测等。数据集还包含一个测试集,大小为2406349850字节,包含44780个示例。下载大小为651260802字节。
提供机构:
Multimodal-Fatima
原始信息汇总
数据集概述
数据集名称
VQAv2_test_no_image_split_0
数据集特征
基本特征
- question_type: 字符串类型
- multiple_choice_answer: 字符串类型
- answers: 字符串序列类型
- answers_original: 列表类型,包含以下子特征:
- answer: 字符串类型
- answer_confidence: 字符串类型
- answer_id: 整数类型(64位)
- id_image: 整数类型(64位)
- answer_type: 字符串类型
- question_id: 整数类型(64位)
- question: 字符串类型
- id: 整数类型(64位)
- clip_tags_ViT_L_14: 字符串序列类型
- blip_caption: 字符串类型
- LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14: 字符串序列类型
检测特征
- DETA_detections_deta_swin_large_o365_coco_classes: 列表类型,包含以下子特征:
- attribute: 字符串类型
- box: 浮点序列类型(32位)
- label: 字符串类型
- location: 字符串类型
- ratio: 浮点类型(32位)
- size: 字符串类型
- tag: 字符串类型
描述特征
- Attributes_ViT_L_14_descriptors_text_davinci_003_full: 字符串序列类型
- clip_tags_ViT_L_14_wo_openai: 字符串序列类型
- clip_tags_ViT_L_14_with_openai: 字符串序列类型
- clip_tags_LAION_ViT_H_14_2B_wo_openai: 字符串序列类型
- clip_tags_LAION_ViT_H_14_2B_with_openai: 字符串序列类型
- clip_tags_LAION_ViT_bigG_14_2B_wo_openai: 字符串序列类型
- clip_tags_LAION_ViT_bigG_14_2B_with_openai: 字符串序列类型
- Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full: 字符串序列类型
- Attributes_LAION_ViT_bigG_14_2B_descriptors_text_davinci_003_full: 字符串序列类型
随机模块特征
- DETA_detections_deta_swin_large_o365_coco_classes_caption_module_random: 列表类型,包含以下子特征:
- attribute: 字符串类型
- box: 浮点序列类型(64位)
- captions_module: 字符串序列类型
- captions_module_filter: 字符串序列类型
- label: 字符串类型
- location: 字符串类型
- ratio: 浮点类型(64位)
- size: 字符串类型
- tag: 字符串类型
数据集分割
- test: 包含44780个样本,数据量大小为2406349850字节。
数据集大小
- 下载大小: 651260802字节
- 数据集大小: 2406349850字节



