five

YunxinLi/Multimodal_Insturction_Data_V2

收藏
Hugging Face2023-06-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/YunxinLi/Multimodal_Insturction_Data_V2
下载链接
链接失效反馈
官方服务:
资源简介:
该版本的Multimodal Instruction Data数据集包含了多样且高质量的下游数据,涵盖了VQA、Detector、Detailed Description of Image等多个领域。数据集中包含了约2M个样本,并提供了各个子数据集的样本数量统计。这些统计数据可以用于训练视觉-语言模型时的加权随机采样。

该版本的Multimodal Instruction Data数据集包含了多样且高质量的下游数据,涵盖了VQA、Detector、Detailed Description of Image等多个领域。数据集中包含了约2M个样本,并提供了各个子数据集的样本数量统计。这些统计数据可以用于训练视觉-语言模型时的加权随机采样。
提供机构:
YunxinLi
原始信息汇总

数据集概述

数据集名称

Multimodal Instruction Data

数据集版本

当前版本

数据集内容

包含约2M样本,涵盖以下子数据集:

  • aokvqa_qa: 17056样本
  • vsr_tof: 7680样本
  • flickr30k_caption: 158914样本
  • esnlive_evil: 401717样本
  • nocaps_caption: 45000样本
  • okvqa_qg: 9009样本
  • okvqa_qa: 9009样本
  • openvqa_qa: 34602样本
  • minigpt4_description: 3439样本
  • chart2image_chart: 8305样本
  • minigpt4_detailed-qa: 17195样本
  • vqav2_qa: 443757样本
  • llava_detailed-qa: 356753样本
  • vqav2_qg: 443757样本
  • semart_art: 20313样本
  • coco_caption: 591753样本
  • refcoco_detector: 8540样本
  • visdial_QA: 1000样本
  • gqa_qa: 943000样本
  • scienceqa_scienceqa: 6218样本
  • iconqa_qa: 29859样本
  • textcaps_caption: 109765样本

数据集用途

适用于训练Visual-Language Models时的WeightRandom采样。

许可证

Apache-2.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作