five

magnustral-sft

收藏
Hugging Face2025-12-20 更新2025-12-21 收录
下载链接:
https://huggingface.co/datasets/mags0ft/magnustral-sft
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含缩短的推理跟踪,旨在辅助微调推理模型以提高令牌效率。数据来源于多个仓库的推理跟踪和问题-回答对,通过使用特定的系统提示和模型进行缩短处理,以去除不必要的闲聊,同时保留问题解决的关键细节。
创建时间:
2025-12-17
原始信息汇总

Magnustral Fine-Tuning Dataset 概述

数据集基本信息

  • 许可证: Apache-2.0
  • 总下载大小: 4,368,557 字节
  • 数据集大小: 10,624,203 字节

数据集结构与内容

  • 特征:
    • messages: 一个列表,其中每个元素包含:
      • role: 字符串类型
      • content: 字符串类型
      • reasoning: 字符串类型
  • 数据划分:
    • train (训练集):
      • 样本数量: 754
      • 字节大小: 10,624,203

数据集目的

该数据集包含经过缩短的推理轨迹,旨在辅助微调推理模型,以提高其令牌使用效率。

生成过程

  1. 源数据:

    • 推理轨迹和问题-响应对取自以下存储库:
      • https://huggingface.co/datasets/TeichAI/claude-4.5-opus-high-reasoning-250x
      • https://huggingface.co/datasets/TeichAI/deepseek-v3.2-speciale-1000x
      • https://huggingface.co/datasets/TeichAI/kimi-k2-thinking-250x
  2. 处理方式:

    • 使用 OpenRouter 上的 mistralai/mistral-small-3.2-24b-instruct 模型进行缩短。
    • 使用特定的系统提示词指导压缩过程,旨在激进地削减推理轨迹,移除所有不直接影响问题解决的不必要闲聊,同时保留解决问题所需的重要细节。压缩后的文本不要求语法正确或构成有效句子,但解决方案的每一步仍需清晰。探索不同可能性的尝试会被保留,仅作缩短处理。
搜集汇总
数据集介绍
main_image_url
构建方式
在推理模型优化领域,数据集的构建往往需要兼顾质量与效率。Magnustral-sft数据集通过整合多个高质量推理轨迹源,包括Claude、DeepSeek和Kimi等先进模型的输出,形成初始语料库。随后,采用Mistral-small-3.2-24b-instruct模型,配合精心设计的系统提示,对原始推理轨迹进行压缩处理。这一过程旨在去除冗余的对话内容,保留直接影响问题解决的关键推理步骤,同时允许语法不完整,以最大化信息密度,最终生成754条精炼的推理样本。
特点
该数据集的核心特征在于其高度凝练的推理表达形式。每条数据均包含角色、内容和推理三个字段,其中推理部分经过压缩处理,呈现出类似思维链的简洁结构。这种设计不仅显著降低了token消耗,还保留了探索不同可能性的尝试过程,使得模型能够学习到高效的问题解决路径。数据集覆盖了数学、逻辑、语言等多种推理场景,示例展示了从单词统计到几何优化的多样化任务,为模型提供了丰富的训练素材。
使用方法
在模型微调实践中,该数据集适用于提升推理模型的token效率。使用者可以直接加载数据集,利用其中的messages字段进行监督式微调,特别关注reasoning字段的压缩格式。训练时应引导模型模仿这种精炼的推理风格,在保持解题清晰度的前提下减少冗余输出。数据集适用于多种开源框架,如Hugging Face Transformers,通过标准的数据加载流程即可集成到训练管道中,助力开发更紧凑、高效的推理模型。
背景与挑战
背景概述
在大型语言模型(LLM)推理能力优化的研究浪潮中,提升模型的推理效率与资源消耗之间的平衡成为关键议题。Magnustral-sft数据集应运而生,由TeichAI等研究机构于近期构建,其核心目标在于通过精炼的推理轨迹数据,对模型进行微调,以显著降低推理过程中的计算开销。该数据集聚焦于解决大语言模型在复杂推理任务中普遍存在的推理链冗长、计算冗余问题,旨在推动模型在保持高准确性的同时,实现更高的计算与存储效率,对高效能人工智能系统的开发具有重要影响。
当前挑战
该数据集致力于应对大语言模型推理效率优化的核心挑战,即如何在压缩推理过程的同时,不丢失对问题解决至关重要的逻辑细节与探索性尝试,这要求模型在缩短的推理轨迹中仍能保持完整的思维连贯性。在构建过程中,挑战主要源于对原始多源推理数据的自动化压缩处理,需要设计精准的提示工程来引导模型进行极度凝练但信息保真的改写,并确保生成的数据格式统一、无多余修饰,同时维持语法灵活性与核心步骤的清晰可辨。
常用场景
经典使用场景
在大型语言模型推理能力优化领域,Magnustral-sft数据集被经典地应用于微调推理模型,以提升其生成推理轨迹的令牌效率。该数据集通过压缩来自多个高性能模型的详细推理链,保留了核心解题步骤,同时大幅削减冗余表达,使得模型能够在保持准确性的前提下,以更精炼的文本完成复杂逻辑任务。这一场景直接服务于模型轻量化与推理加速的研究需求,为构建高效能、低成本的推理专用模型提供了高质量的监督数据。
解决学术问题
该数据集主要解决了大型语言模型在生成链式思维(Chain-of-Thought)时产生的文本冗长、计算资源消耗过大的学术问题。通过提供经过人工指令引导压缩的推理轨迹,它促进了模型在保持逻辑连贯性与问题解决能力的同时,学习生成高度凝练的中间推理步骤。这不仅有助于探索模型推理的紧凑表示,也对理解模型如何平衡信息密度与任务性能具有重要理论意义,为高效推理建模开辟了新的研究方向。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在高效推理模型的架构设计与训练方法上。例如,研究者利用其探索了知识蒸馏、令牌效率优化以及推理轨迹的自动压缩算法。这些工作不仅推动了如Mistral系列等紧凑模型在推理任务上的性能提升,也催生了针对推理链进行剪枝与重构的新技术。此外,该数据集也为评估模型在信息浓缩与逻辑保持方面的能力提供了基准,促进了轻量化推理模型的标准化评测体系发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作