LLaVA多模态Reasoning数据集-满血R1蒸馏
收藏魔搭社区2026-06-05 更新2025-03-15 收录
下载链接:
https://modelscope.cn/datasets/modelscope/LLaVA-R1-100k
下载链接
链接失效反馈官方服务:
资源简介:
LLaVA多模态Reasoning数据集,使用满血版R1蒸馏LLaVA-CoT-100k数据集蒸馏而成。
The LLaVA Multimodal Reasoning Dataset is distilled from the LLaVA-CoT-100K dataset using the full-scale R1 model.
提供机构:
maas
创建时间:
2025-03-12
搜集汇总
数据集介绍

背景与挑战
背景概述
LLaVA-R1-100k是一个包含98,422个样本的大规模多模态自然语言推理数据集,基于LLaVA-CoT-100k构建,采用GPT4-o生成图像描述和DeepSeek-R1生成推理对话的流程。该数据集简化了原有CoT数据格式,提供token消耗统计,并涵盖通用VQA与科学VQA等多样化数据来源,当前版本基于规则的准确率为49.75%。
以上内容由遇见数据集搜集并总结生成



