claude-gemini-reasoning

Hugging Face2026-03-07 更新2026-03-08 收录

下载链接：

https://huggingface.co/datasets/Aadeshisdoingsomething/claude-gemini-reasoning

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含13,627个经过高度整理和去重的问题，这些问题需要深入的多步推理、复杂逻辑、高级数学、物理和编程能力。数据来源于多个高质量的推理数据集，并优先采用了由顶级模型（包括Claude Opus 4.6/4.5、Gemini 3/3.1 Pro和Claude 4.5 Sonnet）生成的回答。数据集经过严格的清理和去重处理，采用了一种称为“模型优先级排序”的系统来保留最高质量的输出。数据格式采用对话式`messages`格式，并集成了`<think>`标签，非常适合用于DeepSeek-R1风格的微调。每个助手响应都包含一个`<think>`块，其中包含逐步推理过程，后跟最终答案。该数据集适用于微调模型以实现R1风格的“思考”行为，以及处理复杂的STEM任务和代码推理问题。

This dataset comprises 13,627 highly curated and deduplicated questions that demand deep multi-step reasoning, complex logical analysis, advanced mathematical, physical, and programming capabilities. It is sourced from multiple high-quality reasoning datasets, and prioritizes responses generated by leading models including Claude Opus 4.6/4.5, Gemini 3/3.1 Pro, and Claude 4.5 Sonnet. The dataset has been subjected to rigorous cleaning and deduplication, utilizing a "model priority ranking" system to preserve the highest-quality outputs. The dataset adopts a conversational `messages` format and integrates `<think>` tags, making it ideal for DeepSeek-R1-style fine-tuning. Each assistant response contains a `<think>` block that outlines the step-by-step reasoning process, followed by the final answer. This dataset is well-suited for fine-tuning models to exhibit R1-style "thinking" behaviors, as well as addressing complex STEM tasks and code reasoning problems.

创建时间：

2026-02-28

原始信息汇总

Claude-gemini-reasoning 数据集概述

数据集基本信息

许可证：MIT
语言：英语
标签：推理、数学、编程、逻辑、合成、代码
规模类别：10K < n < 100K
配置名称：default
数据文件：dataset_final.jsonl（训练集）

数据集内容与规模

包含 13,627 个经过高度策划和去重的问题。
问题需要深入的多步推理、复杂逻辑、高等数学、物理和编程能力。
数据经过精心清理和去重，源自多个高质量推理数据集。
优先采用顶级模型生成的回答，包括 Claude Opus 4.6/4.5、Gemini 3/3.1 Pro 和 Claude 4.5 Sonnet。

数据来源

数据集整合了以下来源的数据：

https://huggingface.co/datasets/nohurry/Opus-4.6-Reasoning-3000x-filtered
https://huggingface.co/datasets/crownelius/Opus-4.6-Reasoning-2100x-formatted
https://huggingface.co/datasets/reedmayhew/gemini-3.1-pro-2048-reasoning-1100x
https://huggingface.co/datasets/TeichAI/claude-4.5-opus-high-reasoning-250x
https://huggingface.co/datasets/Roman1111111/gemini-3-pro-10000x-hard-high-reasoning
https://huggingface.co/datasets/TeichAI/gemini-3-pro-preview-high-reasoning-1000x
https://huggingface.co/datasets/TeichAI/claude-sonnet-4.5-high-reasoning-250x

数据处理与过滤

执行了去重处理。
当不同来源出现相似问题时，采用模型排名优先级系统保留最高质量的输出：
1. Opus 4.6
2. Claude 4.5 Opus
3. Gemini 3.1 Pro
4. Gemini 3 Pro
5. Claude 4.5 Sonnet

数据格式

采用对话式 messages 格式，并集成了 <think> 标签，非常适合 DeepSeek-R1 风格的微调。
每个条目包含用户问题（role: "user"）和助手回答（role: "assistant"）。
助手回答包含一个 <think> 块，其中是逐步推理过程，随后是最终答案。

主要用途

微调模型以实现 R1 风格的“思考”行为。
复杂 STEM 任务：高等物理和研究生水平的数学问题。
代码推理：逻辑密集的软件工程问题。

注意事项

大约 22% 的数据其推理过程被截断。建议暂时从这些示例中移除推理部分，以获取一些非推理示例。

搜集汇总

数据集介绍

构建方式

在人工智能推理任务领域，高质量数据集的构建是推动模型性能提升的关键。Claude-gemini-reasoning数据集通过整合多个开源的高质量推理数据集，如Opus-4.6和Gemini系列，并采用严格的去重与优先级筛选机制。构建过程中，当发现相似问题时，依据模型等级优先级系统保留最优输出，确保数据集中每一条记录都代表顶尖模型的推理能力。经过精心清洗与整理，最终形成了包含13,627条高度精选样本的集合，为复杂推理任务提供了可靠的数据基础。

特点

该数据集的核心特征在于其专注于深度多步推理、复杂逻辑、高等数学、物理学及编程等高级认知任务。数据格式采用对话式消息结构，并融入了<think>标签以模拟逐步推理过程，完美契合DeepSeek-R1风格的微调需求。每条样本均包含用户问题与助理回复，其中助理回复内嵌的思考块清晰展示了从问题分析到最终答案的完整逻辑链条，为模型学习透明化推理提供了结构化范例。

使用方法

针对需要提升复杂推理能力的语言模型，本数据集可直接应用于微调训练，尤其适合旨在模拟R1式“思考”行为的模型优化。使用者可加载数据集文件，按照提供的消息格式进行模型训练，重点让模型学习<think>块内的推理模式与最终答案的生成。该数据集特别适用于高级STEM任务和代码推理场景，建议在已具备一定推理基础的模型上进行微调，以充分发挥其促进深层逻辑理解与问题解决能力的价值。

背景与挑战

背景概述

在人工智能迈向通用智能的进程中，复杂推理能力的构建成为核心瓶颈。Claude-gemini-reasoning数据集应运而生，它并非由单一研究机构创建，而是社区研究者通过集成与精炼多个高质量开源数据集而成，其核心使命在于为大型语言模型的推理能力微调提供优质语料。该数据集聚焦于解决深度多步推理、复杂逻辑、高等数学、物理学及编程等高级认知任务，旨在推动模型超越表层模式匹配，实现真正意义上的思维链（Chain-of-Thought）与内在推理。其构建借鉴了如DeepSeek-R1等先进模型的推理格式，通过整合Claude Opus、Gemini等顶尖模型的输出，力求在合成数据领域树立新的质量标杆，对提升AI在STEM领域的深层问题解决能力具有显著意义。

当前挑战

该数据集致力于应对高级认知任务中模型推理的挑战，其核心是解决如何让AI系统进行透明、可信且步骤严谨的复杂逻辑运算与问题求解。具体挑战体现在两方面：其一，在领域问题层面，如何确保模型生成的思维链不仅结构正确，更能体现深层的物理、数学原理与编程逻辑，避免“模仿风格而非理解本质”的陷阱；其二，在构建过程中，挑战源于多源异构数据的融合与去重，需要设计如“模型优先级排序”的精密策略以保留最优输出，同时还需处理原始数据中部分推理链被截断的质量瑕疵，这要求后续清洗工作具备极高的细致度与判断力。

常用场景

经典使用场景

在人工智能领域，复杂推理能力的培养是模型迈向通用智能的关键阶梯。Claude-gemini-reasoning数据集以其精心策划的深度多步推理问题，为模型微调提供了经典范例。该数据集特别适用于训练模型模仿R1风格的“思维链”行为，其对话式消息格式内嵌的<think>标签，能够引导模型在生成最终答案前展示完整的逻辑推导过程。这种设计使得模型在处理需要逐步分析的复杂问题时，能够学习如何结构化地组织内部推理，从而提升其解决高难度STEM任务与代码逻辑问题的能力。

衍生相关工作

基于高质量推理数据集的研究，往往能催生一系列推动领域进步的经典工作。Claude-gemini-reasoning作为多个顶级源数据集的集成与精炼成果，其本身便继承了如DeepSeek-R1等模型在思维链微调方面的先进理念。可以预见，该数据集将促进新型推理专用模型架构的探索，激发关于模型内部推理过程可解释性的深入研究，并可能衍生出针对数学证明、物理模拟或代码合成等特定子领域的专项评测基准与微调方案，持续丰富复杂推理模型的技术生态。

数据集最近研究