LLaVA多模态Reasoning数据集-满血R1蒸馏

Name: LLaVA多模态Reasoning数据集-满血R1蒸馏
Creator: maas
Published: 2026-06-05 16:26:39
License: 暂无描述

魔搭社区2026-06-05 更新2025-03-15 收录

下载链接：

https://modelscope.cn/datasets/modelscope/LLaVA-R1-100k

下载链接

链接失效反馈

官方服务：

资源简介：

LLaVA多模态Reasoning数据集，使用满血版R1蒸馏LLaVA-CoT-100k数据集蒸馏而成。

The LLaVA Multimodal Reasoning Dataset is distilled from the LLaVA-CoT-100K dataset using the full-scale R1 model.

提供机构：

maas

创建时间：

2025-03-12

搜集汇总

数据集介绍

背景与挑战

背景概述

LLaVA-R1-100k是一个包含98,422个样本的大规模多模态自然语言推理数据集，基于LLaVA-CoT-100k构建，采用GPT4-o生成图像描述和DeepSeek-R1生成推理对话的流程。该数据集简化了原有CoT数据格式，提供token消耗统计，并涵盖通用VQA与科学VQA等多样化数据来源，当前版本基于规则的准确率为49.75%。

以上内容由遇见数据集搜集并总结生成