LLaVA-Instruct-150K
收藏魔搭社区2026-05-16 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/AI-ModelScope/LLaVA-Instruct-150K
下载链接
链接失效反馈官方服务:
资源简介:
# LLaVA Visual Instruct 150K Dataset Card
## Dataset details
**Dataset type:**
LLaVA Visual Instruct 150K is a set of GPT-generated multimodal instruction-following data.
It is constructed for visual instruction tuning and for building large multimodal towards GPT-4 vision/language capability.
**Dataset date:**
LLaVA Visual Instruct 150K was collected in April 2023, by prompting GPT-4-0314 API.
**Paper or resources for more information:**
https://llava-vl.github.io/
**License:**
Creative Commons Attribution 4.0 International; and it should abide by the policy of OpenAI: https://openai.com/policies/terms-of-use
**Where to send questions or comments about the model:**
https://github.com/haotian-liu/LLaVA/issues
## Intended use
**Primary intended uses:**
The primary use of LLaVA is research on large multimodal models and chatbots.
**Primary intended users:**
The primary intended users of the model are researchers and hobbyists in computer vision, natural language processing, machine learning, and artificial intelligence.
# LLaVA 视觉指令150K数据集卡片
## 数据集详情
**数据集类型:**
LLaVA 视觉指令150K是一组由GPT生成的多模态指令遵循数据集,其构建目的为开展视觉指令微调研究,以及打造具备GPT-4视觉-语言能力的大型多模态模型。
**数据集采集时间:**
LLaVA 视觉指令150K于2023年4月通过调用GPT-4-0314 API完成采集。
**相关论文或参考资源:**
https://llava-vl.github.io/
**许可协议:**
采用知识共享署名4.0国际许可协议(Creative Commons Attribution 4.0 International),同时需遵守OpenAI相关使用政策:https://openai.com/policies/terms-of-use
**数据集相关问题反馈渠道:**
https://github.com/haotian-liu/LLaVA/issues
## 预期用途
**核心用途:**
LLaVA的主要应用场景为大型多模态模型与聊天机器人相关研究。
**目标受众:**
该数据集的主要使用者为计算机视觉、自然语言处理、机器学习及人工智能领域的研究人员与爱好者。
提供机构:
maas
创建时间:
2024-05-09
搜集汇总
数据集介绍

背景与挑战
背景概述
LLaVA-Instruct-150K是一个由GPT-4生成的多模态指令跟随数据集,旨在通过视觉指令调优帮助构建具备GPT-4级别视觉/语言能力的大型多模态模型。该数据集收集于2023年4月,主要用于研究领域,面向计算机视觉和人工智能的研究者及爱好者,采用CC BY 4.0许可证并需遵循OpenAI使用政策。
以上内容由遇见数据集搜集并总结生成



