dhanishtha-2.0-superthinker

Name: dhanishtha-2.0-superthinker
Creator: MLX Community
Published: 2025-07-23 23:39:29
License: 暂无描述

Hugging Face2025-07-23 更新2025-07-24 收录

下载链接：

https://huggingface.co/datasets/mlx-community/dhanishtha-2.0-superthinker

下载链接

链接失效反馈

官方服务：

资源简介：

SUPERTHINKER是一个包含11.7K高质量多语言样本的数据集，展示了多阶段推理和结构化情感认知。这些样本来自Dhanishtha-2.0模型的内部训练数据，适用于监督微调，并包括递归推理块和情感状态建模。

提供机构：

MLX Community

创建时间：

2025-07-10

原始信息汇总

📦 Dhanishtha-2.0-SUPERTHINKER-MLX 数据集概述

📊 基本信息

许可证: Apache-2.0
标签: AI、Intermediate Thinking、Multilingual、Reasoning、Emotional Intelligence、Dhanishtha、HelpingAI、Structured Thinking、Self-Correction、Chain-of-Thought、CoT
任务类别: 文本生成
语言: 包含39种语言，如英语、中文、法语、阿拉伯语、俄语等
数据规模: 10K<n<100K

🌟 核心特点

数据量: 11.7K高质量样本
格式: 指令-输出格式，适用于监督微调
多语言支持: 涵盖多种语言，包括但不限于英语、中文、法语等
创新点: 包含递归推理块<think>...</think>和情感状态建模<ser>...</ser>

🔍 详细描述

中间思考（Intermediate Thinking）

特点: 支持自我纠正、问题澄清和多视角合成
示例: 包含多个<think>块，展示模型如何在不同阶段进行推理和修正

结构化情感推理（Structured Emotional Reasoning）

特点: 通过<ser>...</ser>块编码模型的情感状态
字段:
- Emotion: 推断用户的情绪状态
- Cause: 情绪的触发原因
- Mind: 模型的认知立场
- Growth: 模型的学习轨迹

� 数据收集与处理

来源: 来自Dhanishtha-2.0的内部训练数据
过滤: 随机采样0.25%的数据，确保推理块的结构完整性
验证: 手动检查1000个样本，确保标签语法正确

📝 数据格式

jsonl {"messages": [{ "role": "system", "content": ""}, {"role": "user", "content": ""},{"role": "assistant", "content": ""}]}

🎯 预期用途

微调多语言或情感感知的LLM
评估伦理和道德不确定性下的对齐性
基准测试多阶段推理或内部独白生成

📄 引用

bibtex @misc{HAI2025dhanishtha, title = {Dhanishtha-2.0: A Large Language Model with Intermediate Thinking and Structured Empathy}, author = {Abhay Koul and Varun Gupta}, year = {2025}, publisher = {HelpingAI}, howpublished = {url{https://huggingface.co/HelpingAI/Dhanishtha-2.0-SUPERTHINKER}} }

搜集汇总

数据集介绍

构建方式

在人工智能与多语言推理领域，Dhanishtha-2.0-SUPERTHINKER数据集通过精心筛选11.7K高质量样本构建而成，源自Dhanishtha-2.0大型语言模型的内部训练数据。数据集采用多阶段标注策略，包含<think>推理块与<ser>情感认知块的结构化标注，覆盖39种语言。数据经过随机采样、启发式解析及去重处理，确保样本的多样性与结构完整性，同时保留原始数据中的多语言特性与思维链式推理模式。

使用方法

研究者可通过MLX-LM框架直接加载数据集进行监督微调，支持最大4096序列长度的模型训练。典型应用场景包括：基于<think>块的多阶段推理能力增强、利用<ser>块的情感认知建模、以及多语言链式思维（CoT）任务的基准测试。数据以JSONL格式组织，适配主流文本生成管道，特别适用于需要自我修正机制或跨文化情感理解的AI系统开发。

背景与挑战

背景概述

Dhanishtha-2.0-SUPERTHINKER数据集由HelpingAI团队于2025年推出，作为其旗舰大语言模型Dhanishtha-2.0的训练数据子集，旨在推动多语言环境下中间思维（Intermediate Thinking）和结构化情感认知的研究。该数据集包含11.7万条高质量样本，覆盖39种语言，通过独特的<think>和<ser>标记块实现了多阶段推理与情感状态建模的融合。其核心创新在于突破了传统语言模型单次推理的局限，通过递归式自我修正机制，为复杂问题求解、伦理决策等场景提供了新的研究范式，显著提升了模型在哲学讨论、技术问题解决等领域的表现力。

当前挑战

该数据集面临双重挑战：在领域问题层面，如何精准建模多语言混合场景下的中间思维过程仍存在难度，特别是不同语言文化背景对情感标注（<ser>块）的差异性影响尚未完全解决；在构建过程中，数据采样仅保留原始训练集的0.25%且未进行人工质量过滤，虽然通过启发式解析确保了标记结构的完整性，但样本覆盖的均衡性与低资源语言的表现力仍需验证。此外，递归推理块（<think>）与情感状态块（<ser>）的时序关联建模，以及代码切换样本的处理效率，均为当前亟待突破的技术瓶颈。

常用场景

经典使用场景

在自然语言处理领域，Dhanishtha-2.0-SUPERTHINKER数据集因其独特的中间思维和结构化情感认知特性，成为训练多语言大语言模型的理想选择。该数据集通过<think>和<ser>标签的嵌套结构，展示了模型在生成响应过程中的多阶段推理和自我修正能力，特别适用于需要复杂逻辑推理和情感理解的场景。

解决学术问题

该数据集有效解决了大语言模型在推理过程中缺乏自我修正能力和情感认知的学术难题。通过引入中间思维机制，模型能够在生成响应时进行多次反思和调整，显著提升了复杂问题解答的准确性和逻辑连贯性。同时，结构化情感标注为情感计算领域提供了新的研究范式，推动了人机交互中情感理解的深入探索。

实际应用

在实际应用中，该数据集为开发具有情感智能的对话系统提供了重要支撑。客服机器人、心理咨询助手等应用场景可通过该数据集训练出能够理解用户情感状态并作出恰当回应的智能体。多语言特性更使其在全球化服务部署中展现出独特优势，满足不同文化背景用户的多样化需求。

数据集最近研究