five

cactus-instruction-template

收藏
Hugging Face2025-04-24 更新2025-04-25 收录
下载链接:
https://huggingface.co/datasets/Mariam23232/cactus-instruction-template
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于心理咨询服务对话的文本数据集,基于认知行为理论,对话提示被重新格式化为指令模板格式。数据集包含了训练集和测试集,适用于构建和评估心理咨询服务对话模型。
创建时间:
2025-04-23
搜集汇总
数据集介绍
main_image_url
构建方式
在心理咨询对话领域,cactus-instruction-template数据集基于认知行为理论框架构建,通过对原始cactus数据集进行结构化重构而成。研究者采用指令模板格式重新组织了训练提示,删除了部分冗余数据并进行了细微调整,使数据更符合心理治疗对话的指导性特征。该过程严格遵循了原始论文《Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral Theory》提出的方法论,确保了数据转换的学术严谨性。
特点
作为心理咨询领域的专业数据集,其核心优势在于融合了认知行为疗法的理论基础与实用对话模板。数据集包含56,166条训练样本和6,240条测试样本,每条数据均包含文本内容和长度标记两个特征维度。文本字段采用字符串格式存储对话内容,长度字段则以序列化的int64类型记录文本结构信息,这种双特征设计为模型训练提供了更丰富的语义线索。
使用方法
该数据集特别适合用于开发基于认知行为疗法的心理咨询对话系统。使用者可通过HuggingFace平台直接获取经过标准化处理的数据文件,其中训练集和测试集已预先分割。研究人员可以加载这些数据来微调大型语言模型,或构建专门的对话生成系统。值得注意的是,使用时应参考原始论文中的实验设计,以充分发挥数据集在心理治疗对话建模方面的独特价值。
背景与挑战
背景概述
Cactus-instruction-template数据集源于2024年由LangAGI-Lab团队主导的心理咨询对话研究项目,其核心目标是将认知行为疗法(CBT)理论框架转化为结构化指令模板。该数据集基于《Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral Theory》论文提出的原始对话语料,通过重构训练提示模板,为人工智能辅助心理咨询系统提供标准化输入输出范式。作为心理咨询与自然语言处理交叉领域的重要资源,该数据集推动了基于认知行为疗法的对话系统在情绪识别、认知重构等关键任务上的可解释性研究。
当前挑战
数据集构建面临双重挑战:在领域问题层面,心理咨询对话需要精准捕捉非结构化情绪表达与认知行为模式之间的复杂映射关系,这对指令模板的语义覆盖范围和心理学专业性提出极高要求;在技术实现层面,原始对话数据涉及敏感隐私信息,需在保持治疗有效性的前提下完成严格的匿名化处理,同时平衡认知行为疗法术语体系与自然语言表达之间的转换一致性。数据重构过程中还需解决多轮对话的指令连贯性维护,以及治疗阶段标记与对话行为对齐等技术难题。
常用场景
经典使用场景
在心理健康领域,cactus-instruction-template数据集为基于认知行为理论的心理咨询对话系统提供了标准化的指令模板。该数据集通过结构化文本和长度标注,支持研究者构建能够模拟专业心理咨询师对话流程的AI模型,特别适用于需要遵循特定治疗框架的对话场景。
实际应用
在实际应用中,该数据集支撑的心理对话系统已用于辅助心理咨询师开展认知行为治疗,通过标准化的对话流程确保治疗规范性。同时为心理健康类聊天机器人提供核心对话逻辑,在保证专业性的前提下实现7×24小时的心理支持服务。
衍生相关工作
基于该数据集衍生的经典工作包括LangAGI-Lab开发的认知行为治疗对话系统,以及多项关于治疗性对话自动评估的研究。这些工作进一步细化了心理咨询对话的评估维度,推动了心理健康领域自然语言处理技术的标准化进程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作