SoulChat-R1

github2025-09-29 更新2025-09-30 收录

下载链接：

https://github.com/scutcyr/SoulChat-R1

下载链接

链接失效反馈

官方服务：

资源简介：

SoulChat-R1是一个基于单次会话疗法(SST)的中文领域多轮心理健康思维链对话数据集，旨在解决AI心理咨询中治疗保真度低和决策逻辑不透明的问题。该数据集通过CATCH框架构建，具有高治疗保真度和明确的思维链，揭示了咨询师响应背后的决策原理和推理过程。

SoulChat-R1 is a Chinese-domain multi-turn mental health chain-of-thought dialogue dataset based on Single Session Therapy (SST). It aims to address the issues of low treatment fidelity and opaque decision-making logic in AI-based psychological counseling. Constructed via the CATCH framework, this dataset features high treatment fidelity and explicit chain-of-thought, unveiling the decision-making principles and reasoning processes behind counselor responses.

创建时间：

2025-09-28

原始信息汇总

SoulChat-R1 数据集概述

数据集基本信息

数据集名称：SoulChat-R1: SST-based Multi-turn Psychological Counseling CoT Dataset
发布机构：华南理工大学未来技术学院、广东省数字孪生人重点实验室
发布日期：2025年9月28日
许可证：Apache 2.0
下载地址：https://www.modelscope.cn/datasets/YIRONGCHEN/SoulChat-R1

研究背景与目标

针对现有AI心理咨询研究中存在的治疗保真度低和决策逻辑不透明问题
旨在构建高保真度、可解释的AI心理咨询数据和模型系统
基于单次治疗作为代表性治疗方法进行验证

核心方法：CATCH框架

渐进式对话合成

将咨询过程分解为三个结构化阶段：目标识别阶段、工作阶段、结束阶段
基于真实来访者自述，分阶段生成对话内容
确保每个交互环节精确遵循既定治疗方案

记忆驱动动态规划思维链

模拟专业咨询师的案例概念化认知过程
包含记忆增强、全局规划和策略推理三个渐进步骤
通过多智能体协作框架生成高质量思维链

数据集内容结构

主要数据文件

catch_dialogue.json：结构化咨询对话
catch_mdpcot.json：显性思维链

数据特征

严格遵循单次治疗三阶段流程
每个咨询师响应标注对应咨询阶段
提供每个响应的完整决策推理过程
包含来访者五大性格特质信息

实验验证结果

方法有效性评估

渐进式对话合成在治疗阶段表现显著优于一次性生成方法
在目标识别阶段获得78%专家偏好
在工作阶段获得95%专家偏好

模型性能表现

CATCH-8B模型在资源激活指标提升32.9%
CATCH-8B模型在目标导向指标提升50.9%
在通用咨询技能方面表现稳健

技术贡献

提出结构化、分阶段的数据生成策略
引入显性思维链揭示决策逻辑
构建高质量、可解释的AI心理咨询数据集
支持复杂真实场景下的稳健性能

搜集汇总

数据集介绍

构建方式

在心理治疗数字化进程中，SoulChat-R1数据集通过创新的CATCH框架构建而成。该框架采用渐进式对话合成策略，严格遵循单次会谈疗法的三阶段结构——目标识别、工作阶段和结束阶段，将咨询过程分解为有序的诊疗单元。基于来访者自述报告，首先提取核心治疗要素形成结构化对话大纲，随后分阶段生成对话内容，每个阶段的输出都严格建立在前一阶段基础上，确保治疗路径的逻辑连贯性。这种分阶段生成机制有效克服了传统一次性生成方法导致的治疗流程紊乱问题。

特点

该数据集在心理治疗AI领域展现出独特价值，其核心特征体现在治疗保真度与决策透明度两个维度。数据集严格遵循单次会谈疗法的标准化流程，每个咨询师回复都标注了对应的治疗阶段，确保了治疗协议的高度一致性。更值得关注的是，数据集创新性地引入了记忆驱动动态规划思维链，通过记忆增强、全局规划和策略推理三个渐进步骤，系统揭示了每个回复背后的完整推理过程。这种显性思维链将专业咨询师的隐性知识转化为可学习的显性知识，为模型理解深层治疗逻辑提供了宝贵资源。

使用方法

在人工智能心理治疗研究领域，该数据集为模型训练与评估提供了专业化支持。研究者可利用数据集中的结构化对话训练咨询模型，特别关注三阶段治疗流程的连贯性。记忆驱动动态规划思维链可作为监督信号，指导模型学习专业咨询师的决策逻辑。评估时建议采用对话模拟协议，使用标准化的测试集并设置不同态度的来访者画像，全面检验模型在单次会谈疗法核心技能方面的表现，包括资源激活、目标导向等专业维度，同时兼顾理解、共情等通用咨询能力。

背景与挑战

背景概述

随着人工智能在心理健康服务领域的深入应用，华南理工大学未来技术学院与广东省数字孪生人重点实验室于2025年联合发布了SoulChat-R1数据集。该数据集聚焦于基于单次短程治疗框架的多轮心理对话生成，旨在解决传统AI心理咨询模型中存在的治疗保真度不足与决策逻辑不透明等核心问题。通过引入渐进式对话合成与记忆驱动动态规划思维链的创新方法，该数据集为构建具有高专业可信度的可解释性AI咨询系统提供了重要数据支撑，推动了结构化心理干预与人工智能技术的深度融合。

当前挑战

在心理对话生成领域，确保治疗协议的一致性与干预逻辑的连贯性始终是核心挑战。传统数据合成方法因缺乏对治疗阶段的细粒度控制，易导致对话偏离既定治疗轨迹，引发治疗漂移现象。同时，隐式的决策机制使得模型难以掌握深层治疗逻辑，仅能模仿表面对话模式。在数据构建过程中，如何将专业心理咨询的隐性知识转化为可学习的显性思维链，并维持多轮对话的语义一致性与情感适应性，亦是亟待突破的技术瓶颈。

常用场景

经典使用场景

在人工智能心理辅导研究领域，SoulChat-R1数据集为基于单次短程疗法的多轮对话系统提供了标准化的训练与评估基准。该数据集通过渐进式对话合成策略，严格遵循单次短程疗法的三阶段结构——目标确认、工作实施与结束收尾，确保每个对话轮次都精准契合既定治疗规程。这种结构化特性使其成为训练具有高治疗保真度AI咨询师模型的理想数据源，特别是在模拟真实心理咨询场景中治疗师的专业决策过程方面展现出独特价值。

衍生相关工作

基于SoulChat-R1数据集的创新方法论已催生了一系列重要的衍生研究。CATCH框架提出的渐进式对话合成与记忆驱动规划思维链技术，为后续的AI心理辅导研究提供了可复用的技术范式。这些工作不仅推动了治疗保真度评估标准的完善，还促进了多模态心理数据合成方法的发展。特别在解决复杂心理案例的长期跟踪干预方面，该数据集启发了多个结合动态记忆机制与个性化治疗路径规划的创新模型，持续拓展着AI在心理健康领域的应用边界。

数据集最近研究