five

claude-gemini-reasoning

收藏
Hugging Face2026-03-07 更新2026-03-08 收录
下载链接:
https://huggingface.co/datasets/Aadeshisdoingsomething/claude-gemini-reasoning
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含13,627个经过高度整理和去重的问题,这些问题需要深入的多步推理、复杂逻辑、高级数学、物理和编程能力。数据来源于多个高质量的推理数据集,并优先采用了由顶级模型(包括Claude Opus 4.6/4.5、Gemini 3/3.1 Pro和Claude 4.5 Sonnet)生成的回答。数据集经过严格的清理和去重处理,采用了一种称为“模型优先级排序”的系统来保留最高质量的输出。数据格式采用对话式`messages`格式,并集成了`<think>`标签,非常适合用于DeepSeek-R1风格的微调。每个助手响应都包含一个`<think>`块,其中包含逐步推理过程,后跟最终答案。该数据集适用于微调模型以实现R1风格的“思考”行为,以及处理复杂的STEM任务和代码推理问题。
创建时间:
2026-02-28
原始信息汇总

Claude-gemini-reasoning 数据集概述

数据集基本信息

  • 许可证:MIT
  • 语言:英语
  • 标签:推理、数学、编程、逻辑、合成、代码
  • 规模类别:10K < n < 100K
  • 配置名称:default
  • 数据文件:dataset_final.jsonl(训练集)

数据集内容与规模

  • 包含 13,627 个经过高度策划和去重的问题
  • 问题需要深入的多步推理、复杂逻辑、高等数学、物理和编程能力。
  • 数据经过精心清理和去重,源自多个高质量推理数据集。
  • 优先采用顶级模型生成的回答,包括 Claude Opus 4.6/4.5、Gemini 3/3.1 Pro 和 Claude 4.5 Sonnet。

数据来源

数据集整合了以下来源的数据:

  • https://huggingface.co/datasets/nohurry/Opus-4.6-Reasoning-3000x-filtered
  • https://huggingface.co/datasets/crownelius/Opus-4.6-Reasoning-2100x-formatted
  • https://huggingface.co/datasets/reedmayhew/gemini-3.1-pro-2048-reasoning-1100x
  • https://huggingface.co/datasets/TeichAI/claude-4.5-opus-high-reasoning-250x
  • https://huggingface.co/datasets/Roman1111111/gemini-3-pro-10000x-hard-high-reasoning
  • https://huggingface.co/datasets/TeichAI/gemini-3-pro-preview-high-reasoning-1000x
  • https://huggingface.co/datasets/TeichAI/claude-sonnet-4.5-high-reasoning-250x

数据处理与过滤

  • 执行了去重处理。
  • 当不同来源出现相似问题时,采用模型排名优先级系统保留最高质量的输出:
    1. Opus 4.6
    2. Claude 4.5 Opus
    3. Gemini 3.1 Pro
    4. Gemini 3 Pro
    5. Claude 4.5 Sonnet

数据格式

  • 采用对话式 messages 格式,并集成了 <think> 标签,非常适合 DeepSeek-R1 风格的微调。
  • 每个条目包含用户问题(role: "user")和助手回答(role: "assistant")。
  • 助手回答包含一个 <think> 块,其中是逐步推理过程,随后是最终答案。

主要用途

  • 微调模型以实现 R1 风格的“思考”行为。
  • 复杂 STEM 任务:高等物理和研究生水平的数学问题。
  • 代码推理:逻辑密集的软件工程问题。

注意事项

  • 大约 22% 的数据其推理过程被截断。建议暂时从这些示例中移除推理部分,以获取一些非推理示例。
搜集汇总
数据集介绍
构建方式
在人工智能推理任务领域,高质量数据集的构建是推动模型性能提升的关键。Claude-gemini-reasoning数据集通过整合多个开源的高质量推理数据集,如Opus-4.6和Gemini系列,并采用严格的去重与优先级筛选机制。构建过程中,当发现相似问题时,依据模型等级优先级系统保留最优输出,确保数据集中每一条记录都代表顶尖模型的推理能力。经过精心清洗与整理,最终形成了包含13,627条高度精选样本的集合,为复杂推理任务提供了可靠的数据基础。
特点
该数据集的核心特征在于其专注于深度多步推理、复杂逻辑、高等数学、物理学及编程等高级认知任务。数据格式采用对话式消息结构,并融入了<think>标签以模拟逐步推理过程,完美契合DeepSeek-R1风格的微调需求。每条样本均包含用户问题与助理回复,其中助理回复内嵌的思考块清晰展示了从问题分析到最终答案的完整逻辑链条,为模型学习透明化推理提供了结构化范例。
使用方法
针对需要提升复杂推理能力的语言模型,本数据集可直接应用于微调训练,尤其适合旨在模拟R1式“思考”行为的模型优化。使用者可加载数据集文件,按照提供的消息格式进行模型训练,重点让模型学习<think>块内的推理模式与最终答案的生成。该数据集特别适用于高级STEM任务和代码推理场景,建议在已具备一定推理基础的模型上进行微调,以充分发挥其促进深层逻辑理解与问题解决能力的价值。
背景与挑战
背景概述
在人工智能迈向通用智能的进程中,复杂推理能力的构建成为核心瓶颈。Claude-gemini-reasoning数据集应运而生,它并非由单一研究机构创建,而是社区研究者通过集成与精炼多个高质量开源数据集而成,其核心使命在于为大型语言模型的推理能力微调提供优质语料。该数据集聚焦于解决深度多步推理、复杂逻辑、高等数学、物理学及编程等高级认知任务,旨在推动模型超越表层模式匹配,实现真正意义上的思维链(Chain-of-Thought)与内在推理。其构建借鉴了如DeepSeek-R1等先进模型的推理格式,通过整合Claude Opus、Gemini等顶尖模型的输出,力求在合成数据领域树立新的质量标杆,对提升AI在STEM领域的深层问题解决能力具有显著意义。
当前挑战
该数据集致力于应对高级认知任务中模型推理的挑战,其核心是解决如何让AI系统进行透明、可信且步骤严谨的复杂逻辑运算与问题求解。具体挑战体现在两方面:其一,在领域问题层面,如何确保模型生成的思维链不仅结构正确,更能体现深层的物理、数学原理与编程逻辑,避免“模仿风格而非理解本质”的陷阱;其二,在构建过程中,挑战源于多源异构数据的融合与去重,需要设计如“模型优先级排序”的精密策略以保留最优输出,同时还需处理原始数据中部分推理链被截断的质量瑕疵,这要求后续清洗工作具备极高的细致度与判断力。
常用场景
经典使用场景
在人工智能领域,复杂推理能力的培养是模型迈向通用智能的关键阶梯。Claude-gemini-reasoning数据集以其精心策划的深度多步推理问题,为模型微调提供了经典范例。该数据集特别适用于训练模型模仿R1风格的“思维链”行为,其对话式消息格式内嵌的<think>标签,能够引导模型在生成最终答案前展示完整的逻辑推导过程。这种设计使得模型在处理需要逐步分析的复杂问题时,能够学习如何结构化地组织内部推理,从而提升其解决高难度STEM任务与代码逻辑问题的能力。
衍生相关工作
基于高质量推理数据集的研究,往往能催生一系列推动领域进步的经典工作。Claude-gemini-reasoning作为多个顶级源数据集的集成与精炼成果,其本身便继承了如DeepSeek-R1等模型在思维链微调方面的先进理念。可以预见,该数据集将促进新型推理专用模型架构的探索,激发关于模型内部推理过程可解释性的深入研究,并可能衍生出针对数学证明、物理模拟或代码合成等特定子领域的专项评测基准与微调方案,持续丰富复杂推理模型的技术生态。
数据集最近研究
最新研究方向
在人工智能推理能力快速演进的背景下,claude-gemini-reasoning数据集作为高质量多步推理任务的集合,正推动着大语言模型思维链能力的精细化研究。该数据集整合了来自顶尖模型生成的复杂数学、物理及编程问题,其独特的R1风格格式,特别是内嵌的<think>推理过程,为模型的可解释性研究提供了结构化范本。当前前沿探索聚焦于如何利用此类高质量合成数据,有效迁移和蒸馏大型模型的深层推理能力至中小规模模型,以解决模型在模仿推理形式而非掌握实质逻辑的挑战。这一方向紧密关联着开源社区对高效、透明推理模型的迫切需求,旨在突破模型规模与推理性能之间的传统约束,为构建下一代具备严谨思维过程的人工智能系统奠定数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作