YunxinLi/Multimodal_Insturction_Data_V2
收藏Hugging Face2023-06-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/YunxinLi/Multimodal_Insturction_Data_V2
下载链接
链接失效反馈官方服务:
资源简介:
该版本的Multimodal Instruction Data数据集包含了多样且高质量的下游数据,涵盖了VQA、Detector、Detailed Description of Image等多个领域。数据集中包含了约2M个样本,并提供了各个子数据集的样本数量统计。这些统计数据可以用于训练视觉-语言模型时的加权随机采样。
该版本的Multimodal Instruction Data数据集包含了多样且高质量的下游数据,涵盖了VQA、Detector、Detailed Description of Image等多个领域。数据集中包含了约2M个样本,并提供了各个子数据集的样本数量统计。这些统计数据可以用于训练视觉-语言模型时的加权随机采样。
提供机构:
YunxinLi
原始信息汇总
数据集概述
数据集名称
Multimodal Instruction Data
数据集版本
当前版本
数据集内容
包含约2M样本,涵盖以下子数据集:
- aokvqa_qa: 17056样本
- vsr_tof: 7680样本
- flickr30k_caption: 158914样本
- esnlive_evil: 401717样本
- nocaps_caption: 45000样本
- okvqa_qg: 9009样本
- okvqa_qa: 9009样本
- openvqa_qa: 34602样本
- minigpt4_description: 3439样本
- chart2image_chart: 8305样本
- minigpt4_detailed-qa: 17195样本
- vqav2_qa: 443757样本
- llava_detailed-qa: 356753样本
- vqav2_qg: 443757样本
- semart_art: 20313样本
- coco_caption: 591753样本
- refcoco_detector: 8540样本
- visdial_QA: 1000样本
- gqa_qa: 943000样本
- scienceqa_scienceqa: 6218样本
- iconqa_qa: 29859样本
- textcaps_caption: 109765样本
数据集用途
适用于训练Visual-Language Models时的WeightRandom采样。
许可证
Apache-2.0



