five

MMR1/MMR1-RL

收藏
Hugging Face2025-10-01 更新2025-10-18 收录
下载链接:
https://hf-mirror.com/datasets/MMR1/MMR1-RL
下载链接
链接失效反馈
官方服务:
资源简介:
MMR1数据集是一个包含约160万长链式思维(CoT)冷启动轨迹和约1.5万强化学习QA对的大型多模态推理数据集。这些数据覆盖了数学、科学、图表/图形、文档表格和一般理解等多个领域,结合了现有的公共资源(如MathVerse、ScienceQA、ChartQA、DocVQA、GQA)以及新策划和自收集的数据,确保了数据的质量、难度和多样性。

The MMR1 dataset is a large-scale multimodal reasoning dataset containing about 1.6 million long Chain-of-Thought (CoT) cold-start trajectories and about 15,000 reinforcement learning QA pairs. These data cover multiple domains including mathematics, science, charts/figures, document tables, and general understanding, integrating existing public resources (such as MathVerse, ScienceQA, ChartQA, DocVQA, GQA) with newly curated and self-collected data to ensure quality, difficulty, and diversity.
提供机构:
MMR1
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作