YunxinLi/Multimodal_Insturction_Data_V2

Name: YunxinLi/Multimodal_Insturction_Data_V2
Creator: YunxinLi
Published: 2023-06-12 07:22:55
License: 暂无描述

Hugging Face2023-06-12 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/YunxinLi/Multimodal_Insturction_Data_V2

下载链接

链接失效反馈

官方服务：

资源简介：

该版本的Multimodal Instruction Data数据集包含了多样且高质量的下游数据，涵盖了VQA、Detector、Detailed Description of Image等多个领域。数据集中包含了约2M个样本，并提供了各个子数据集的样本数量统计。这些统计数据可以用于训练视觉-语言模型时的加权随机采样。

提供机构：

YunxinLi

原始信息汇总

数据集概述

数据集名称

Multimodal Instruction Data

数据集版本

当前版本

数据集内容

包含约2M样本，涵盖以下子数据集：

aokvqa_qa: 17056样本
vsr_tof: 7680样本
flickr30k_caption: 158914样本
esnlive_evil: 401717样本
nocaps_caption: 45000样本
okvqa_qg: 9009样本
okvqa_qa: 9009样本
openvqa_qa: 34602样本
minigpt4_description: 3439样本
chart2image_chart: 8305样本
minigpt4_detailed-qa: 17195样本
vqav2_qa: 443757样本
llava_detailed-qa: 356753样本
vqav2_qg: 443757样本
semart_art: 20313样本
coco_caption: 591753样本
refcoco_detector: 8540样本
visdial_QA: 1000样本
gqa_qa: 943000样本
scienceqa_scienceqa: 6218样本
iconqa_qa: 29859样本
textcaps_caption: 109765样本

数据集用途

适用于训练Visual-Language Models时的WeightRandom采样。

许可证

Apache-2.0

5,000+

优质数据集

54 个

任务类型

进入经典数据集