认知扭曲检测与积极重构数据集
收藏arXiv2024-05-24 更新2024-06-21 收录
下载链接:
https://github.com/405200144/Dataset-of-CognitiveDistortion-detection-and-Positive-Reconstruction/tree/main
下载链接
链接失效反馈官方服务:
资源简介:
本研究构建了首个中文认知扭曲检测与积极重构数据集,包含4001条用于检测认知扭曲的实例和1900条用于积极重构的实例。数据集基于真实的心理咨询问答语句,由心理学专业人士标注。该数据集不仅支持认知扭曲的自动检测,还通过五种不同的积极心理学策略进行句子重构,旨在帮助个体以更积极的方式理解和应对负面思维。此数据集的应用领域广泛,特别是在心理健康支持领域,有助于开发更有效的自动化工具,以支持个体在认知重构过程中的需求。
This study constructs the first Chinese dataset for cognitive distortion detection and positive reframing, which contains 4001 instances for cognitive distortion detection and 1900 instances for positive reframing. The dataset is built upon real psychological counseling question-and-answer utterances and annotated by professional psychologists. This dataset not only supports automatic detection of cognitive distortions, but also performs sentence reframing via five distinct positive psychology strategies, with the goal of helping individuals understand and cope with negative thoughts in a more positive manner. It covers a wide range of application fields, particularly in the mental health support domain, and can facilitate the development of more effective automated tools to meet individuals' needs during the cognitive reframing process.
提供机构:
深圳国际研究生院,清华大学
创建时间:
2024-05-24
搜集汇总
数据集介绍

构建方式
该数据集的构建方式是基于积极心理学理论,旨在通过积极的重新解释来解决和重构消极思想。数据集包含两个主要部分:认知扭曲检测和积极重构。认知扭曲检测部分的数据集包含4001个实例,由经过训练的心理学家根据Burns的10分类标准进行标注。积极重构部分的数据集包含1900个实例,每个句子都根据积极心理学理论中的五种不同策略进行了重构。数据收集主要利用了一个名为PsyQA的中国心理问答数据集,该数据集与心理问题相关,并且倾向于包含具有认知扭曲的陈述。为了确保数据质量,研究人员进行了预测试、情感评估和手动评估。
特点
该数据集的特点在于其基于积极心理学理论的积极重构框架,以及包含真实世界对话的认知扭曲检测数据集。数据集涵盖了五种不同的积极重构策略,包括乐观、感恩、个人成长、放松心态和接纳。这些策略旨在从积极的角度重新构建消极思想,从而帮助个体培养更客观的观点。此外,该数据集还提供了对各种NLP模型和训练策略的基准测试,以评估其在认知扭曲检测和积极重构任务上的有效性。
使用方法
该数据集的使用方法包括认知扭曲检测和积极重构两个任务。对于认知扭曲检测任务,可以使用预训练的RoBERTa-wwm-ext网络进行微调或使用不同的读取策略(线性、多层感知器、LSTM)进行迁移学习。对于积极重构任务,可以使用P-tuning、微调或提示工程等不同方法。数据集还提供了自动评估和人工评估的指标,以评估重构句子的语义相似性、积极性和整体质量。
背景与挑战
背景概述
随着现代社会生活节奏的加快和高压生活方式的普遍存在,心理健康问题日益凸显。世界卫生组织(WHO)报告指出,抑郁症是全球范围内影响身心健康的重大因素。为应对这一挑战,WHO于2023年11月成立了新的社会联系委员会,强调对抗孤独这一健康危害的紧迫性。在这样的背景下,负面情绪与消极思维模式之间的关联性日益受到关注,而认知扭曲作为一种常见的思维模式,其识别与重构成为心理健康干预的关键。本研究引入了一个基于积极心理学理论的积极重构框架,旨在通过积极的重新诠释来克服负面思维。为此,研究团队构建了首个包含4001个认知扭曲检测实例和1900个积极重构实例的中文语料库,并利用了包括迁移学习、微调和提示工程在内的最新自然语言处理(NLP)技术,展示了自动化工具在这两项任务中的有效性。本研究对多语言积极重构的贡献,突显了NLP在认知扭曲检测和积极重构领域的潜力,为心理健康支持提供了新的途径。
当前挑战
尽管近年来NLP在心理健康领域的应用日益增多,但语言特定的数据集仍然稀缺。目前,心理健康NLP领域的数据集主要集中在英语,缺乏针对其他语言的专用数据集,这限制了NLP模型在不同语言和文化背景下的实际应用。此外,构建数据集过程中遇到的挑战包括:1)认知扭曲检测的标注一致性,由于认知扭曲的分类标准和识别方法存在差异,导致标注结果的一致性难以保证;2)积极重构的多样性和有效性,需要探索不同的重构策略并评估其有效性;3)跨语言和文化差异的挑战,需要构建更多语言的数据集,以适应不同语言和文化背景下的心理健康需求。
常用场景
经典使用场景
认知扭曲检测与积极重构数据集的经典使用场景在于心理健康的辅助诊断和治疗。通过自然语言处理技术,该数据集能够识别和重构认知扭曲的句子,帮助个体识别和纠正消极思维模式。这对于心理健康专业人士来说,可以作为一种辅助工具,帮助他们更快速、更准确地识别认知扭曲,并针对性地进行积极重构。同时,对于普通用户来说,该数据集也可以作为一种自我检测和自我疗愈的工具,帮助他们识别和纠正自己的认知扭曲,从而改善心理健康状况。
解决学术问题
认知扭曲检测与积极重构数据集解决了传统心理健康诊断和治疗中存在的几个关键问题。首先,该数据集为认知扭曲的检测和重构提供了大量的标注数据,有助于提高NLP模型在认知扭曲识别和重构任务上的准确性和效率。其次,该数据集为心理健康领域的研究提供了新的视角和方法,有助于推动心理健康领域的研究和发展。最后,该数据集为心理健康专业人士和普通用户提供了一种新的工具和手段,有助于提高心理健康服务的质量和效率。
衍生相关工作
认知扭曲检测与积极重构数据集衍生了多项相关研究。首先,该数据集促进了认知扭曲检测和重构技术的进一步发展,如基于深度学习的认知扭曲检测模型和基于预训练语言模型的积极重构模型。其次,该数据集推动了心理健康领域的研究,如基于NLP的心理健康评估模型和基于NLP的心理健康干预模型。最后,该数据集推动了心理健康产品的开发,如开发基于NLP的智能聊天机器人和基于NLP的心理健康应用程序。
以上内容由遇见数据集搜集并总结生成



