Adaptive_Skip_thinking_Reasoning

Hugging Face2025-08-04 更新2025-08-05 收录

下载链接：

https://huggingface.co/datasets/Siesher/Adaptive_Skip_thinking_Reasoning

下载链接

链接失效反馈

官方服务：

资源简介：

cerebras-adaptive-reasoning-ru是一个合成数据集，旨在通过从大型语言模型(LLM)向小型语言模型(SLM)转移推理能力来训练模型进行自适应思维和有效策略选择。该数据集生成使用了Cerebras的强大模型(qwen-3-235b-a22b)作为“教师”，展示了多种解决多步骤任务的方法。数据集提供了针对同一问题的多种推理策略的答案示例，包括详细的逐步推理（CoT）、包含代码块的推理（PoT）和分解推理（Skip-Thinking）。该数据集适用于需要逻辑思维、数学计算、空间分析等多种推理形式的俄语任务。

cerebras-adaptive-reasoning-ru is a synthetic dataset designed to train models for adaptive thinking and effective strategy selection by transferring reasoning capabilities from large language models (LLMs) to small language models (SLMs). This dataset was generated using Cerebras' high-performance model (qwen-3-235b-a22b) as the "teacher" model, which showcases multiple methods for solving multi-step tasks. The dataset provides answer examples with diverse reasoning strategies for identical problems, including detailed step-by-step Chain-of-Thought (CoT) reasoning, Program-of-Thought (PoT) reasoning with code blocks, and decomposed Skip-Thinking reasoning. This dataset is applicable to Russian-language tasks requiring various forms of reasoning such as logical thinking, mathematical computation, and spatial analysis.

创建时间：

2025-07-27

原始信息汇总

数据集概述：Cerebras Adaptive Reasoning (Russian)

基本信息

许可证: Apache-2.0
任务类别: 文本生成、推理（包括链式思维、程序化思维、跳跃思维）
语言: 俄语 (ru)
标签: 代码、合成数据
数据集名称: Ada_Think
规模: 1K < n < 10K 样本

数据集描述

cerebras-adaptive-reasoning-ru 是一个合成数据集，旨在通过从大型语言模型（LLM）到小型语言模型（SLM）的知识蒸馏，训练自适应思维和高效选择推理策略的能力。数据集由 Cerebras 模型（如 qwen-3-235b-a22b）生成，展示了多种解决多步任务的策略。

主要特点

多样化推理策略:
- Chain-of-Thought (CoT): 详细的逐步推理。
- Program-of-Thought (PoT): 包含 Python 代码块的推理。
- Skip-Thinking: 将推理分解为原子块，带有 <continue_thinking> 或 <end_of_thought> 标记。
覆盖领域: 逻辑思维、数学计算、空间分析等俄语任务。

数据集目标

知识蒸馏: 将教师模型的推理能力传递给更小的模型。
可控推理训练: 学习何时及如何应用不同推理策略。
可解释性提升: 通过 <think> 标签跟踪和分析决策过程。

数据结构

格式: JSON Lines (.jsonl)
每条记录结构: json { "messages": [ { "role": "user", "content": "问题文本" }, { "role": "assistant", "content": "<thought_type>{类型}</thought_type> <think> {推理文本} </think> {最终答案}" } ] }

字段说明

messages: 对话消息列表。
- role: "user" 或 "assistant"。
- content: 消息内容（问题或包含推理的答案）。

示例

Chain-of-Thought (CoT)

json { "messages": [ { "role": "user", "content": "如果花园里有10棵苹果树，每棵产20公斤苹果，总共能收获多少苹果？" }, { "role": "assistant", "content": "<thought_type>CoT</thought_type> <think> 推理步骤... </think> 200公斤" } ] }

Program-of-Thought (PoT)

json { "messages": [ { "role": "user", "content": "5乘以8再加3等于多少？" }, { "role": "assistant", "content": "<thought_type>PoT</thought_type> <think> Python代码块... </think> 43" } ] }

Skip-Thinking

json { "messages": [ { "role": "user", "content": "法国的首都是哪里？" }, { "role": "assistant", "content": "<thought_type>SkipThinking</thought_type> <think> <chunk_start>...<end_of_thought> </think> 巴黎" } ] }

数据生成

生成工具: Python 脚本（使用 Cerebras API）。
教师模型: qwen-3-235b-a22b。
生成设置:
- 独特问题数量: 400。
- 每个问题的策略数量: 6。
- 推理长度: CoT/PoT 100-200词，SkipThinking 30-50词。
- 问题主题: 逻辑谜题、数学、空间思维等。

使用示例

python from datasets import load_dataset dataset = load_dataset("your_org/cerebras-adaptive-reasoning-ru")

引用

bibtex @misc{cerebras_adaptive_reasoning_ru_2025, author = {{Cerebras Systems} and {Siesher}}, title = {{Cerebras Adaptive Reasoning (Russian) Dataset}}, year = {2025}, publisher = {{Hugging Face}}, url = {https://huggingface.co/datasets/Siesher/cerebras-adaptive-reasoning-ru} }

相关资源

数据生成脚本: https://github.com/Siesher/Generator_for_reasoning

搜集汇总

数据集介绍

构建方式

在知识蒸馏研究领域，数据质量直接影响模型推理能力的迁移效果。本数据集采用多阶段合成生成方法：首先通过Cerebras Qwen-3-235B-A22B模型生成400个覆盖16个学科领域的独特问题，随后使用并行计算技术为每个问题生成6种不同推理策略的解答样本，最终通过标准化模板将问题-答案对格式化为JSONL结构。生成过程严格控制推理长度，CoT和PoT策略保持100-200词规模，Skip-Thinking则采用30-50词的原子化思维块设计。

使用方法

研究者可通过Hugging Face数据集库直接加载该资源，使用标准接口获取JSONL格式的训练样本。每个样本包含用户查询和助理响应两个消息单元，其中助理消息采用特定标签结构封装推理过程：<thought_type>标签标识推理策略类型，<think>标签包裹详细推理内容，最终答案置于标签外部。训练时可提取完整消息序列进行全参数微调，或分离推理路径与最终答案进行分阶段训练。代码库提供数据生成脚本支持自定义扩展，用户可调整问题领域和推理策略权重生成适配特定需求的数据变体。

背景与挑战

背景概述

随着大规模语言模型在推理任务中的广泛应用，如何将复杂模型的推理能力有效蒸馏至轻量级模型成为关键研究课题。Cerebras Systems与Siesher于2025年联合发布的俄语自适应推理数据集，专注于多策略推理的知识迁移，涵盖链式思维、程序化思维及跳跃思维三种推理范式。该数据集通过Qwen-3-235B-A22B作为教师模型生成合成数据，旨在提升小模型在数学计算、空间推理及逻辑分析等复杂任务中的自适应推理能力，为俄语自然语言处理领域的模型优化提供重要资源。

当前挑战

该数据集需解决多策略推理的动态选择问题，即模型需根据问题复杂度自主选用链式推理、程序化代码或跳跃思维等不同范式。构建过程中面临合成数据质量控制的挑战，包括教师模型生成推理链的可靠性验证、三种策略间的逻辑一致性维护，以及俄语语境下专业术语与代码混合表达的准确性保障。此外，跳跃思维中的原子化思维块分割需精确匹配继续推理与终止推理的边界标记，这对数据标注规范提出了较高要求。

常用场景

经典使用场景

在自然语言处理领域，该数据集主要应用于知识蒸馏场景，通过大型语言模型生成的多样化推理路径训练小型语言模型。模型通过学习链式思维、程序化思维和跳跃思维三种策略，能够根据问题复杂度自适应选择最优推理方式，显著提升在数学计算、逻辑推理和空间分析等复杂任务中的表现。

解决学术问题

该数据集有效解决了小模型复杂推理能力不足的学术难题，通过显式标注的思维过程提升了模型决策的可解释性。其创新性地将多模态推理策略融合，为模型压缩领域提供了新的技术路径，推动了高效推理模型的发展，对认知计算和可解释人工智能研究具有重要理论价值。

实际应用

在实际应用层面，该数据集支撑的模型可部署于智能教育系统，提供分步骤解题指导；在金融风控领域辅助进行复杂逻辑推理决策；同时适用于多语言客服场景，通过结构化推理提升问答准确率。其俄语特性尤其适用于东欧市场的本地化人工智能服务部署。

数据集最近研究