DepreSym
收藏arXiv2023-08-21 更新2024-06-21 收录
下载链接:
https://erisk.irlab.org/depresym_dataset.html
下载链接
链接失效反馈官方服务:
资源简介:
DepreSym数据集是由信息检索实验室CITIC Universidade da Coruña创建,包含21,580条与Beck Depression Inventory-II(BDI-II)症状相关的句子。数据集内容丰富,涵盖了多种与抑郁症状相关的文本,如悲观、自杀念头等。创建过程中,通过多种排序方法筛选句子,并由三位专家(包括一位心理学专家)进行标注。该数据集主要用于开发基于症状水平的抑郁症筛查模型,旨在提高模型的鲁棒性和解释性。
DepreSym Dataset was developed by the Information Retrieval Laboratory of CITIC, Universidade da Coruña. It contains 21,580 sentences related to the symptoms assessed by the Beck Depression Inventory-II (BDI-II). The dataset covers a diverse range of texts associated with depressive symptoms, including but not limited to pessimism and suicidal ideation. During the dataset construction process, sentences were filtered using multiple ranking methods, and annotated by three experts, among whom one was a psychologist. This dataset is primarily intended for the development of symptom-level depression screening models, aiming to improve the robustness and interpretability of such models.
提供机构:
信息检索实验室,CITIC Universidade da Coruña
创建时间:
2023-08-21
搜集汇总
数据集介绍

构建方式
在心理健康计算分析领域,构建高质量标注数据集对于提升模型泛化能力与可解释性至关重要。DepreSym数据集的构建依托于CLEF 2023 eRisk实验室的共享排名任务,采用了一种严谨的多源融合方法。研究团队首先汇集了来自10个不同团队的37种排名方法,通过top-k池化策略(k=50)从各症状的相关性排序中提取候选句子,形成了初始句子池。为确保标注质量,三位具备不同专业背景的评估者(包括心理学专家)依据严格的双重相关性准则——即句子需既与症状主题相关,又明确反映个体状态信息——进行了独立标注。标注过程经过多轮校准与讨论,最终基于共识机制确定了21,580个句子对21项BDI-II症状的相关性标签,从而构建出一个兼具多样性与临床可信度的抑郁症状标注语料库。
特点
DepreSym数据集的核心特点在于其深度的临床对齐与精细的标注架构。该数据集紧密依托贝克抑郁量表第二版(BDI-II)的21项症状框架,涵盖了情绪、认知与生理等多维抑郁指标,确保了标注内容与临床诊断标准的一致性。其标注体系引入了双重相关性判定准则,不仅要求句子主题与症状匹配,更强调句子需包含个体状态的具体表达,这提升了标注的语义深度与实用性。数据规模上,数据集包含21,580个句子,每个症状标注的句子数量在829至1,150之间,其中被一致判定为相关的句子比例约为11%,反映了标注的严格性与数据的高质量。此外,数据集构建过程还探索了大型语言模型作为辅助评估工具的可行性,为后续研究提供了人机协同标注的参考范式。
使用方法
DepreSym数据集为抑郁症状的细粒度计算研究提供了多方面的应用路径。在模型开发层面,该数据集可直接用于训练或评估症状级别的文本分类与检索模型,助力构建可解释的抑郁筛查系统。研究者可利用句子级别的症状标签,开发能够识别特定抑郁标志物的算法,从而增强模型在社交媒体等开放域文本中的泛化能力。在评估实践中,数据集的共识标注与多数表决标注两种版本,为不同严格度的实验设计提供了灵活性。此外,数据集附带的大语言模型评估对比数据,可用于探索自动化标注方法的效能与局限,推动高效标注流程的创新。该资源也可作为跨领域研究的桥梁,促进临床心理学与计算语言学的知识融合。
背景与挑战
背景概述
在心理健康计算分析领域,基于社交媒体文本的抑郁症检测研究逐渐从依赖通用标记转向关注临床抑郁症状的细粒度识别,以提升模型的泛化能力与可解释性。DepreSym数据集于2023年由西班牙多所大学的研究团队构建,其核心研究问题在于为抑郁症症状的句子级标注提供高质量资源,依据临床广泛使用的贝克抑郁量表第二版(BDI-II)的21项症状框架,对来自社交媒体平台的21,580个句子进行相关性标注。该数据集的创建不仅推动了症状导向的抑郁筛查模型发展,也为探索大型语言模型在复杂心理标记评估中的潜力提供了重要基础。
当前挑战
DepreSym数据集旨在解决抑郁症症状细粒度识别的领域挑战,其标注过程要求句子不仅主题相关,还需明确反映个体与症状相关的状态,这种双重相关性标准增加了标注的复杂性。在构建过程中,研究团队面临标注一致性的难题,即使经过专家讨论与指南优化,人类标注者间的评估一致性仍处于中等水平,反映了心理语言标注的主观性与高要求。此外,探索大型语言模型作为自动标注工具时,模型虽在识别非相关句子上表现可靠,但在相关句子判断上错误率较高,凸显了在敏感心理健康领域中自动化评估的精度与可靠性瓶颈。
常用场景
经典使用场景
在心理健康计算分析领域,DepreSym数据集为基于症状的抑郁症检测模型提供了关键资源。该数据集包含21,580个句子,依据贝克抑郁量表第二版的21种症状进行精细标注,源自社交媒体用户的公开文本。其经典应用场景在于训练和评估自然语言处理模型,以识别文本中与特定抑郁症状相关的表达,从而推动可解释且泛化能力强的心理健康筛查工具的发展。
解决学术问题
DepreSym数据集主要解决了抑郁症检测研究中模型泛化性与可解释性不足的学术难题。传统方法依赖通用特征,难以捕捉个体化的临床标记;而该数据集通过句子级别的症状标注,使研究者能够开发专注于具体抑郁症状的检测模型,如悲观情绪、自杀意念或睡眠问题等。这不仅提升了模型的临床相关性,还为理解语言特征与心理状态之间的关联提供了实证基础,推动了计算精神病学向更精细、更可靠的方向演进。
衍生相关工作
DepreSym数据集衍生了一系列经典研究工作,主要集中在症状导向的抑郁症检测模型和自动标注方法上。例如,基于该数据集的模型被用于改进抑郁症严重度估计,结合临床问卷提升泛化性能。同时,该数据集推动了大型语言模型在复杂心理标注任务中的应用探索,如研究ChatGPT和GPT-4作为自动评估者的可行性,并启发混合标注策略的开发,其中语言模型充当非相关句子的过滤器,以降低人工标注成本并提升效率。
以上内容由遇见数据集搜集并总结生成



