five

CUEMPATHY

收藏
arXiv2024-09-04 更新2024-09-06 收录
下载链接:
https://arxiv.org/pdf/2409.02466v1
下载链接
链接失效反馈
官方服务:
资源简介:
CUEMPATHY是由香港中文大学教育心理学系和电子工程系联合创建的心理治疗语音数据集,包含156个实际心理治疗会话的音频记录和文本转录。数据集涵盖了39对治疗师-客户组合,每对组合有4个会话,总时长数百小时。数据集的创建过程包括语音数据的收集、主观评分和转录,旨在支持语音和语言技术的发展,以高效分析心理治疗互动并提供数据证据用于治疗师培训。该数据集主要应用于心理治疗研究,旨在通过分析语音特征来理解影响有效心理治疗的因素。

CUEMPATHY is a psychotherapy speech dataset jointly created by the Department of Educational Psychology and the Department of Electronic Engineering of The Chinese University of Hong Kong. It contains audio recordings and text transcriptions of 156 actual psychotherapy sessions, covering 39 therapist-client pairs with 4 sessions per pair, and the total duration amounts to hundreds of hours. The dataset creation process includes speech data collection, subjective scoring and transcription. It aims to support the development of speech and language technologies for efficient analysis of psychotherapy interactions, and provide empirical data evidence for therapist training. This dataset is mainly applied in psychotherapy research, with the objective of understanding factors influencing effective psychotherapy via the analysis of speech features.
提供机构:
香港中文大学
创建时间:
2024-09-04
搜集汇总
数据集介绍
main_image_url
构建方式
CUEMPATHY数据集的构建,源于香港中文大学教育学院心理辅导诊所的实际咨询会话录音。该数据集包含了156个咨询会话,涉及39个治疗师与客户配对。每个会话均由一名实习治疗师(硕士研究生)在导师的监督下与寻求帮助的客户进行。数据收集过程中,所有治疗师和客户均使用香港粤语进行交流,并偶尔夹杂英语。数据集的构建注重保护客户的隐私,所有录音均经过严格的数据脱敏处理。录音采集后,会话内容被转录为中文文本,并进行了主观评级,包括第三方观察者评定的治疗师同理心量表(TES)和客户评定的Barrett-Lennard关系量表(BLRI)以及会话评价量表(SES)。为了便于分析,开发了一个自动语音和文本处理系统,用于定位每个会话中讲话者的轮次时间戳。
使用方法
使用CUEMPATHY数据集,研究人员可以进行多种分析,例如,通过分析语音和文本数据,研究治疗师与客户之间的互动模式,以及这些模式如何影响治疗效果。此外,数据集中的主观评级可以帮助研究人员评估治疗师的同理心水平和会话质量。为了使用该数据集,研究人员需要首先了解数据集的结构和内容,然后使用适当的工具和技术进行分析。例如,可以使用语音识别技术将音频数据转换为文本数据,然后使用自然语言处理技术分析文本数据。此外,研究人员还可以使用机器学习技术,根据语音和文本数据预测治疗效果。
背景与挑战
背景概述
心理咨询作为一种通过言语交流进行的活动,其核心在于治疗师与客户之间的互动。CUEMPATHY数据集由香港中文大学的电子工程系和教育心理学系的研究人员创建,旨在通过分析实际咨询会话中的言语特征,以深入理解影响心理咨询效果的因素。该数据集包含了156次咨询会话,涉及39组治疗师-客户对,涵盖了数百小时的音频记录和文本转录。CUEMPATHY的构建不仅为心理咨询领域的研究提供了丰富的数据资源,而且为语音和语言技术的发展提供了实证支持,有助于分析心理咨询互动并提升咨询师培训的质量。
当前挑战
CUEMPATHY数据集的研究面临的主要挑战包括:1) 如何在确保客户隐私的同时,有效地收集和利用心理咨询数据;2) 如何精确地定位每次会话中治疗师和客户的发言时间戳,以便于分析言语特征;3) 如何评估治疗师的同理心,并探究其与咨询效果之间的关系。在构建过程中,研究团队采用了严格的研究伦理标准,并对数据进行匿名处理,以保护客户的隐私。此外,研究团队还开发了一套自动语音和文本处理系统,以实现精确的发言时间戳定位,并通过多种主观评估工具来衡量治疗师的同理心水平。这些挑战的解决不仅需要先进的数据分析技术,还需要严格遵守伦理规范,以确保研究活动的合法性和道德性。
常用场景
经典使用场景
在心理咨询领域,CUEMPATHY数据集被广泛应用于分析咨询过程中的言语特征。该数据集包含156个咨询会话,涉及39个治疗师-客户对,为研究者提供了宝贵的资源。通过分析这些会话,研究者可以了解与有效心理治疗相关的因素,从而优化治疗方案。
解决学术问题
CUEMPATHY数据集解决了心理咨询中治疗师同理心评估的难题。该数据集提供了观察者和客户对治疗师同理心的评分,并揭示了两者之间的相关性。此外,该数据集还揭示了治疗师和客户在语调和强度上的相似性,这可能与心理治疗的结果相关。
实际应用
CUEMPATHY数据集在实际应用中具有广泛的前景。它可以帮助心理咨询师了解自己在咨询过程中的表现,并提供改进的依据。此外,该数据集还可以用于开发语音和语言技术,以便更有效地分析心理咨询互动,并为咨询师培训提供数据支持。
数据集最近研究
最新研究方向
CUEMPATHY数据集的最新研究方向主要集中在对心理咨询互动中语言特征的分析,以揭示影响心理咨询效果的因素。研究包括但不限于探索治疗师的说话风格如何通过语调线索与共情相关联,以及如何利用声学和语言特征评估治疗师的共情水平。此外,研究还关注了在话语边界处的时间模式与治疗师共情之间的关系,以及观察者与客户对治疗师共情的评价差异的原因。这些研究旨在为心理治疗师提供具体的说话指导,并支持心理咨询师培训的数据证据。
相关研究论文
  • 1
    CUEMPATHY: A Counseling Speech Dataset for Psychotherapy Research香港中文大学 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作