five

PsyDTCorpus

收藏
arXiv2025-09-30 收录
下载链接:
https://modelscope.cn/datasets/YIRONGCHEN/PsyDTCorpus/dataPeview
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是由GPT-4生成的多轮心理咨询对话组成,涵盖了10个常见的心理主题,包括人际关系、家庭动态、情绪健康等。为确保主题多样性,数据集从每个主题中选取了最长的对话。该数据集包含了1,000个对话示例,旨在支持心理咨询中的回应生成任务。

This dataset is composed of multi-turn psychological counseling conversations generated by GPT-4, covering 10 common psychological themes including interpersonal relationships, family dynamics, emotional health, and others. To ensure thematic diversity, the longest conversations from each theme were selected for inclusion in this dataset. This dataset contains 1,000 conversation examples and is designed to support response generation tasks in the field of psychological counseling.
提供机构:
Xie et al.
搜集汇总
数据集介绍
main_image_url
构建方式
在心理健康大语言模型领域,现有方法往往忽略了不同心理咨询师在语言风格和治疗技术上的个性化差异。为弥补这一空白,PsyDTCorpus数据集基于PsyDT框架构建,通过动态单样本学习技术,利用GPT-4从真实咨询案例中提取特定咨询师的语言风格与治疗技术。随后,结合从SoulChatCorpus精选的5000条高质量单轮对话,并模拟来访者的大五人格特质,GPT-4被引导将这些单轮对话合成为多轮咨询对话。最终,通过多轮指令微调方法在合成数据集上训练模型,构建出具有个性化咨询风格的心理咨询师数字孪生。
使用方法
PsyDTCorpus专为微调心理健康领域的大语言模型而设计,以构建具有特定咨询风格的心理咨询师数字孪生。使用时,可将该数据集作为训练语料,通过多轮指令微调方法对模型进行参数更新,使模型学习并内化数据中蕴含的个性化咨询风格。在推理阶段,模型能够根据对话历史生成符合特定咨询师语言风格与治疗技术的回应,从而为寻求特定咨询风格的来访者提供更具针对性的心理支持服务。
背景与挑战
背景概述
PsyDTCorpus数据集由华南理工大学未来技术学院与电子与信息学院的谢浩杰、陈奕蓉、邢晓芬等研究人员于2024年创建,旨在解决大语言模型在心理咨询领域忽视咨询师个性化风格的关键问题。该研究指出,现有心理健康大语言模型未考虑不同咨询师在语言风格与治疗技术上的差异,难以满足来访者对多样化咨询风格的个性化需求。PsyDTCorpus通过构建心理咨询师的数字孪生体,利用动态单样本学习与GPT-4合成多轮对话,为心理咨询领域提供了高质量、风格化的数据集,显著推动了心理健康大语言模型的个性化发展。
当前挑战
PsyDTCorpus面临的核心挑战包括:其一,真实多轮心理咨询对话数据因伦理与隐私保护极度稀缺,现有模型难以捕捉咨询师的个性化风格(如语言风格与治疗技术),导致对来访者多样化需求的响应不稳定。其二,构建数字孪生体需大量真实咨询案例,但收集过程耗时且成本高昂。其三,合成对话需确保质量、复杂性与多样性,包括模拟来访者的大五人格特质、动态匹配咨询话题与治疗技术,并避免过度同质化,这对生成模型的准确性与自然性提出了极高要求。
常用场景
经典使用场景
在心理健康与人工智能的交叉领域中,PsyDTCorpus数据集被广泛应用于构建具有个性化咨询风格的咨询师数字孪生。其核心使用场景在于,通过合成多轮心理咨询对话,模拟特定咨询师的语言风格与治疗技术,从而训练大语言模型以提供高度个性化的心理支持。这一数据集弥补了现有心理健康大模型在咨询风格单一性上的不足,为开发能够满足来访者个体化需求的心理咨询系统提供了关键数据基础。
解决学术问题
PsyDTCorpus数据集解决了心理健康大模型忽视咨询师个体风格差异的关键学术问题。传统数据集往往混合多种咨询风格,导致模型回复不稳定且难以满足来访者对特定咨询风格的偏好。通过引入咨询师数字孪生的概念,该数据集能够高效、低成本地合成具有特定语言风格与治疗技术的高质量多轮对话,推动了个性化心理咨询大模型的发展,为心理健康领域的AI研究提供了新的范式。
实际应用
在实际应用中,PsyDTCorpus数据集赋能的心理咨询大模型可用于在线心理服务平台,为来访者提供与特定咨询风格相匹配的对话体验。例如,系统可根据用户偏好或问题类型,动态调用具有不同风格的咨询师数字孪生,实现更精准的情感支持与认知引导。此外,该数据集还可用于心理咨询师的培训模拟,帮助实习咨询师在安全环境中学习不同风格的治疗技巧,提升临床实践能力。
数据集最近研究
最新研究方向
在心理健康大语言模型领域,前沿研究正从通用共情对话能力向个性化咨询风格的数字孪生构建演进。PsyDTCorpus数据集应运而生,其核心创新在于突破传统模型忽视不同心理咨询师个性化语言风格与疗法技术的局限,首次利用大语言模型快速、低成本地合成具有特定咨询风格的高质量多轮对话数据。该研究紧密关联全球心理健康需求激增与AI伦理隐私保护的热点事件,通过动态单样本学习与大五人格模拟,实现了对真实咨询案例在语言风格与疗法技术上的高度对齐。这一方向不仅满足了来访者对差异化咨询风格的个性化需求,更通过构建专业、稳定且安全的数字孪生体,为心理健康服务的可及性与定制化开辟了新路径,其深远意义在于推动AI从通用辅助工具向具备专业人格特质的协同伙伴转型。
相关研究论文
  • 1
    PsyDT: Using LLMs to Construct the Digital Twin of Psychological Counselor with Personalized Counseling Style for Psychological Counseling华南理工大学 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作