MMathCoT-1M, DualMath-1.1M

github2025-02-03 更新2025-02-10 收录

下载链接：

https://github.com/URSA-MATH/URSA-MATH

下载链接

链接失效反馈

官方服务：

资源简介：

MMathCoT-1M是通过蒸馏、轨迹重写和风格自然化三重策略设计的CoT推理数据合成，用于指令微调。DualMath-1.1M是通过双视图过程监督数据合成构建的数据集，专注于逻辑和视觉视角。

MMathCoT-1M is a CoT inference data synthesis designed through a triple strategy of distillation, trajectory rewriting, and style naturalization, intended for instruction fine-tuning. DualMath-1.1M is a dataset constructed through a dual-view process supervision data synthesis, focusing on both logical and visual perspectives.

创建时间：

2025-01-22

搜集汇总

数据集介绍

构建方式

MMathCoT-1M与DualMath-1.1M数据集的构建，采取了分阶段的方法。首先，通过视觉语言对齐、数学指令微调以及PRM训练三个阶段来训练模型架构。数据集的构建则采用了蒸馏、轨迹重写和风格自然化的三元策略，以合成CoT推理数据，进而形成了MMathCoT-1M指令微调数据集。在此基础上，通过双视角过程监督数据合成策略，包括二进制错误定位和视觉误解插入，构建了关注逻辑与视觉视角的数据，形成了DualMath-1.1M数据集。

特点

MMathCoT-1M与DualMath-1.1M数据集的特点在于，它们专为多模态数学推理的链式思维（Chain-of-thought）而设计。MMathCoT-1M数据集通过精心合成的指令微调数据，强化了模型在数学推理方面的能力。而DualMath-1.1M数据集则通过引入双视角监督，进一步提升了模型在逻辑和视觉理解上的准确性。这两个数据集在多个数学推理基准测试中表现突出，为相关领域的研究提供了有力的数据支撑。

使用方法

使用MMathCoT-1M与DualMath-1.1M数据集时，用户可以从Huggingface平台获取这些数据集。通过配置vllm项目，可以适配URSA-8B架构，进而利用vllm进行更快的推理。具体使用步骤包括配置启动脚本、设置推理脚本参数，以及启动vllm进行推理。用户可以根据自己的需求调整温度参数、数据集、图像根目录等，以获得最佳的推理结果。

背景与挑战

背景概述

MMathCoT-1M与DualMath-1.1M数据集，作为URSA项目的一部分，旨在理解和验证多模态数学中的链式推理。该数据集由清华大学与字节跳动的研究团队合作开发，并于2025年发布。研究团队的核心成员包括Ruilin Luo、Zhuofan Zheng等。MMathCoT-1M与DualMath-1.1M的核心研究问题是提升多模态数学推理的准确性和可靠性，对多模态数学推理领域产生了显著影响。

当前挑战

该数据集在构建过程中面临的挑战主要包括：1) 如何设计有效的训练策略以提升模型在数学推理任务上的性能；2) 如何合成高质量的链式推理数据，以及如何将这种推理能力转化为监督能力；3) 在多模态数学推理领域，如何处理逻辑与视觉信息的关系，提高模型的泛化能力和准确性。

常用场景

经典使用场景

MMathCoT-1M与DualMath-1.1M数据集，作为URSA项目的一部分，其经典使用场景在于促进多模态数学推理任务的研究。通过提供大量的数学问题及对应的链式推理过程数据，研究者和开发者可以训练模型以理解和验证数学问题解答的推理链条，进而提升多模态数学理解能力。

衍生相关工作

基于这一数据集，已经衍生出一系列相关工作，包括构建了能够进行链式推理的多模态语言模型URSA-8B，以及首个开源的小型奖励模型URSA-RM-8B，用于在多模态数学推理任务中进行系统2级推理的监督。这些研究进一步扩展了多模态数学推理的领域边界，并推动了相关技术的进步。

数据集最近研究