Magpie-Reasoning-V2
收藏github2025-02-28 更新2025-02-25 收录
下载链接:
https://github.com/little1d/deepseek-qwen-distill
下载链接
链接失效反馈官方服务:
资源简介:
Magpie-Reasoning-V2数据集,包含由DeepSeek-R1生成的250K CoT推理样本,涵盖了数学推理、编码和一般问题解决等不同的任务。
The Magpie-Reasoning-V2 dataset contains 250K Chain-of-Thought (CoT) reasoning samples generated by DeepSeek-R1, covering diverse tasks including mathematical reasoning, coding, and general problem-solving.
创建时间:
2025-02-17
原始信息汇总
蒸馏 DeepSeek-R1 知识到自定义小模型
数据集概述
-
数据集名称:Magpie-Reasoning-V2
-
样本数量:250K
-
样本内容:包含数学推理、编码和一般问题解决等任务的CoT(逐步推理)样本
-
样本结构:
- 指令:任务描述
- 回应:DeepSeek-R1 的逐步推理(CoT)
-
数据格式:JSON格式,例如: json { "instruction": "Solve for x: 2x + 5 = 15", "response": "<think>First, subtract 5 from both sides: 2x = 10. Then, divide by 2: x = 5.</think>" }
-
数据使用:需按照特定模型要求的指令和任务格式进行数据格式化
环境安装
- 所需库:
torchtransformersdatasetsacceleratebitsandbytes
- 额外安装:
flash-attn(需使用--no-build-isolation选项)
参考链接
搜集汇总
数据集介绍

构建方式
Magpie-Reasoning-V2 数据集的构建,是以 DeepSeek-R1 生成的推理样本为基础,通过精细设计指令与回应的对应关系,形成了250K的CoT(逐步推理)样本集。这些样本不仅包含了数学推理,还涉及编码和一般性问题解决等多个领域,构建过程中注重了样本的多样性和任务的复杂性。
特点
该数据集的特点在于其丰富的任务类型和详尽的推理步骤记录。样本中的每个实例均由明确的指令和对应的推理过程构成,为研究者在数学、编码及问题解决等领域的模型训练与评估提供了宝贵的资源。此外,数据集遵循特定的聊天模板格式,有利于模型学习正确的对话模式,进而提升模型的适应性和泛化能力。
使用方法
使用 Magpie-Reasoning-V2 数据集时,首先需要安装相应的环境,包括torch、transformers、datasets等库。数据集以JSON格式存储,用户可依据具体模型的要求,将数据格式化为特定的聊天模板。这种格式化确保了模型能够正确地学习和模仿所需的回话模式,进而实现知识蒸馏的目标。
背景与挑战
背景概述
Magpie-Reasoning-V2数据集,诞生于对DeepSeek-R1模型知识蒸馏需求的研究背景之下,由相关研究人员精心构建,旨在为数学推理、编码及一般问题解决等任务提供丰富的CoT(逐步推理)样本。该数据集自创建以来,便成为促进人工智能在逻辑推理领域深入发展的重要资源,对提升模型的推理能力、理解能力产生了显著影响。
当前挑战
Magpie-Reasoning-V2数据集在构建和应用过程中面临的挑战主要包括:如何确保样本的质量和多样性,以满足不同任务的需求;如何合理地构建聊天模板格式,以适应不同LLM(语言模型)的学习机制;以及如何在模型蒸馏过程中,有效地保留DeepSeek-R1模型的知识精华。这些挑战对数据集的构建者和技术应用者提出了更高的技术要求。
常用场景
经典使用场景
在人工智能领域,尤其是自然语言处理任务中,Magpie-Reasoning-V2 数据集被广泛用于训练和评估模型在数学推理、编码以及一般问题解决等方面的能力。该数据集通过提供详尽的推理步骤,为模型学习复杂的逻辑推理过程提供了宝贵的样本资源。
解决学术问题
Magpie-Reasoning-V2 数据集有效解决了学术研究中推理任务样本不足的问题,它的出现为研究者在构建和测试具有推理能力的智能系统时提供了标准化的数据支撑,极大推动了相关领域的研究进展。
衍生相关工作
基于Magpie-Reasoning-V2 数据集,研究者们已经开展了一系列相关工作,包括但不限于改进模型结构以提高推理能力,探索新的推理任务以及开发用于评估模型推理性能的标准化测试集。
以上内容由遇见数据集搜集并总结生成



