0.9M-thinking
收藏Hugging Face2026-01-16 更新2026-01-17 收录
下载链接:
https://huggingface.co/datasets/PursuitOfDataScience/0.9M-thinking
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含由MiniMax-M2.1生成的响应,这些响应针对来自a-m-team/AM-DeepSeek-R1-Distilled-1.4M数据集(am_0.9M子集)的用户问题。数据集捕获了MiniMax-M2.1的扩展思维过程和最终答案,其中推理过程用<think>标签包裹以便于分离。数据集包含740,341个示例,总标记数为5,191,116,688,平均每个示例7,012个标记。每个示例包含索引、消息列表和使用的总标记数等字段。助理响应包含思维块(用<think>...</think>标签包裹)和最终答案。
创建时间:
2026-01-13
原始信息汇总
0.9M Thinking Dataset 概述
数据集基本信息
- 数据集名称:0.9M Thinking Dataset
- 发布者:PursuitOfDataScience
- 发布日期:2025年
- 许可证:Apache 2.0 License
- 任务类别:文本生成
- 语言:英语
- 标签:推理、思维链、合成数据、Minimax
- 配置名称:default
- 数据文件:
data/train-*.parquet - 数据划分:训练集
- 样本数量:740,341 个示例
数据集来源与生成
- 源数据集:
a-m-team/AM-DeepSeek-R1-Distilled-1.4M数据集中的am_0.9M子集 - 生成模型:MiniMax-M2.1
- 生成参数:最大令牌数为 196,608,并启用了扩展思考功能(模型返回独立的思考块和文本内容块)
数据规模
- 总令牌数:5,191,116,688
- 平均每示例令牌数:7,012
数据格式
每个示例包含以下字段:
idx:整数类型,源数据集中的索引messages:列表类型,包含用户和助手消息的对话num_tokens:整数类型,使用的总令牌数(输入+输出)
响应格式
助手响应包含:
- 思考块:包裹在
<think>...</think>标签内,包含模型的推理过程 - 最终答案:在闭合的
</think>标签之后,包含对用户问题的实际回应
使用方式
可通过 datasets 库加载:
python
from datasets import load_dataset
dataset = load_dataset("PursuitOfDataScience/0.9M-thinking")
引用
如需使用本数据集,请引用: bibtex @misc{0.9m-thinking, title = {0.9M Thinking Dataset}, author = {PursuitOfDataScience}, year = {2025}, publisher = {HuggingFace}, howpublished = {url{https://huggingface.co/datasets/PursuitOfDataScience/0.9M-thinking}} }
搜集汇总
数据集介绍

构建方式
在人工智能推理任务领域,数据集的构建方式直接影响模型对复杂问题的解析能力。0.9M Thinking Dataset 的构建源于对高质量思维链数据的需求,其核心方法是将源数据集 a-m-team/AM-DeepSeek-R1-Distilled-1.4M 中的用户问题作为输入,利用 MiniMax-M2.1 模型生成带有扩展思维过程的响应。生成过程中启用了模型的扩展思维功能,确保每个响应不仅包含最终答案,还通过特定的 <think> 标签封装了详细的推理步骤。这种构建方式使得数据集能够清晰分离思维过程与最终输出,为研究思维链机制提供了结构化的数据基础。
使用方法
在自然语言处理研究中,有效利用数据集是推动模型性能提升的关键。使用该数据集时,可通过 Hugging Face 的 datasets 库直接加载,并访问训练分割中的示例。每条数据包含索引、消息列表及标记数量,其中消息列表存储了用户问题与助理响应的对话内容。为提取思维过程与最终答案,可解析助理响应中的<think>标签,将思维块与答案部分分离。这种使用方法使得研究人员能够便捷地获取模型的推理步骤,进而应用于思维链分析、模型训练或评估任务,促进对推理机制的理解与优化。
背景与挑战
背景概述
在人工智能推理能力快速发展的背景下,2025年由PursuitOfDataScience团队发布的0.9M-thinking数据集应运而生。该数据集基于MiniMax-M2.1大型语言模型,对AM-DeepSeek-R1-Distilled-1.4M数据集的子集进行响应生成,旨在捕获模型在回答问题时的扩展思维过程。其核心研究问题聚焦于通过显式标注的思维链数据,推动复杂推理任务的可解释性研究,并为思维链微调提供高质量资源。该数据集通过结构化呈现模型的内部推理轨迹,为理解人工智能的认知过程提供了宝贵窗口,对提升语言模型的逻辑推理与问题解决能力具有显著影响力。
当前挑战
该数据集致力于解决思维链生成与可解释性研究领域的核心挑战,即如何系统化地获取并呈现大规模语言模型在复杂问题求解中的内部推理轨迹。构建过程中的主要挑战在于确保生成思维链的多样性与逻辑连贯性,同时需精确分离思维过程与最终答案,以避免数据污染。此外,源数据集的质量与覆盖面直接影响生成内容的可靠性,要求对模型参数与生成策略进行精细调控,以平衡思维深度与计算资源消耗,从而构建出既具规模又保持高保真度的推理数据集。
常用场景
经典使用场景
在自然语言处理领域,特别是推理任务的研究中,0.9M Thinking Dataset 为链式思维(Chain-of-Thought)方法的训练与评估提供了关键资源。该数据集通过捕捉模型在生成最终答案前的完整推理过程,使得研究者能够深入分析语言模型如何逐步解决复杂问题。其经典使用场景包括训练模型模仿人类思考模式,提升其在数学推理、逻辑推断和多步骤问题求解中的表现,为理解模型内部认知机制奠定了数据基础。
解决学术问题
该数据集有效应对了人工智能研究中模型可解释性与推理能力提升的核心挑战。通过提供大量带有明确思维标签的合成数据,它助力解决如何使语言模型展现透明、连贯的推理路径这一学术问题。其意义在于推动了推理对齐、思维过程建模以及知识蒸馏等领域的发展,为构建更具逻辑性和可靠性的AI系统提供了实证支持,深刻影响了自动化推理与认知计算的研究方向。
实际应用
在实际应用层面,0.9M Thinking Dataset 能够服务于智能教育辅导、自动化客服以及专业决策支持系统。通过利用数据集中的结构化思维过程,开发者可以构建能够解释自身决策步骤的AI助手,从而增强用户信任并提升交互质量。例如,在教育场景中,系统可展示解题思路,辅助学习者理解复杂概念;在客服领域,则能提供清晰的问题排查逻辑,改善服务体验。
数据集最近研究
最新研究方向
在大型语言模型推理能力研究领域,0.9M-thinking数据集以其大规模、结构化的思维链数据成为前沿探索的关键资源。该数据集源自MiniMax-M2.1模型对用户问题的深度思考过程,明确标注了推理路径与最终答案,为可解释性人工智能与复杂推理任务提供了高质量的训练语料。当前研究热点聚焦于利用此类合成数据优化模型的思维链生成、多步推理以及自我修正能力,旨在突破模型在数学解题、逻辑分析和代码生成等场景中的性能瓶颈。其影响深远,不仅推动了开源社区对模型内部认知过程的透明化研究,也为构建更可靠、更具逻辑性的下一代AI系统奠定了数据基础。
以上内容由遇见数据集搜集并总结生成



