Depression Severity Levels Dataset
收藏github2022-12-15 更新2024-05-31 收录
下载链接:
https://github.com/KUAS-ubicomp-lab/Depression_Severity_Levels_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于人类抑郁症严重程度分类的公开可用语料库的聚合数据集。分类考虑了BDI-3和抑郁症严重程度标注方案(DSAS)作为基准。
This is an aggregated dataset of a publicly available corpus for the classification of human depression severity. The classification takes into account the BDI-3 and the Depression Severity Annotation Scheme (DSAS) as benchmarks.
创建时间:
2022-12-13
原始信息汇总
数据集概述
数据集名称
- Depression Severity Levels Dataset
数据集用途
- 用于研究论文 "HelaDepDet: A Novel Multi-Class Classification Model for Detecting the Severity of Human Depression" 和 "The Correlation between Group Text Chat Behavior and Severity of Human Depression"。
数据集内容
- 该数据集是公开可用的人类抑郁严重程度分类数据集的聚合。
- 分类依据为 BDI-3 和 Depression Severity Annotation Schema (DSAS)。
抑郁严重程度分类
| Depression Severity Class | BDI-3 Score |
|---|---|
| Minimal | 0-9 |
| Mild | 10-18 |
| Moderate | 19-29 |
| Severe | 30-63 |
数据集统计
| Depression Severity Class | Count |
|---|---|
| Minimal | 10,549 |
| Mild | 10,661 |
| Moderate | 9,473 |
| Severe | 11,176 |
抑郁词汇表
| DSAS Criteria | Lexicon |
|---|---|
| Depressed mood most of the day, nearly every day | sadness, anger, bored, hurt, nervousness, moody, emotional |
| Markedly diminished interest or pleasure in activities most of the day, nearly every day | discomfort, unhappy, no-focus,disturbed |
| Changes in appetite that result in weight losses or gains unrelated to dieting | loss of appetite, overeating, weight loss |
| Changes in sleeping patterns | light sleep, waking up early, short sleep, dreamy |
| Loss of energy or increased fatigue | bored, useless, isolation, low interaction, fatigue |
| Restlessness or irritability | uneasiness, instability |
| Feelings of anxiety | stress, pain |
| Feelings of worthlessness, helplessness, or hopelessness | useless, hopeless, helpless, lonely |
| Inappropriate guilt | low self-esteem |
| Difficulty thinking, concentrating, or making decisions | hesitate, tired |
| Thoughts of death or attempts at suicide | long-term grief, hopelessness, end-of-my-life, die, suicide, killmyself, suicidal, broken, worthless, self-harm |
搜集汇总
数据集介绍

构建方式
Depression Severity Levels Dataset的构建基于公开可用的语料库,旨在为人类抑郁严重程度的分类提供数据支持。该数据集依据BDI-3量表和抑郁严重程度注释模式(DSAS)进行标注,确保数据的科学性和准确性。数据集的构建过程中,研究者们整合了多个来源的文本数据,并通过专业的心理评估标准进行严格分类,从而形成了一个包含不同抑郁严重程度类别的综合数据集。
特点
该数据集的特点在于其详细的抑郁严重程度分类,涵盖了从轻微到严重的四个等级,每个等级对应特定的BDI-3分数范围。此外,数据集还引入了由Cha, Kim和Park于2022年提出的抑郁词汇表,进一步丰富了数据的语义维度。数据集的类别分布均衡,涵盖了大量的样本,确保了模型训练的广泛性和代表性。
使用方法
Depression Severity Levels Dataset的使用方法主要包括数据加载、预处理和模型训练。用户可以通过读取数据集文件,获取包含抑郁严重程度类别和对应文本的两列数据。在预处理阶段,可以利用提供的抑郁词汇表进行特征提取和增强。随后,数据集可用于训练多类分类模型,如HelaDepDet模型,以检测和分类抑郁严重程度。通过这种方式,研究者可以有效地利用该数据集进行抑郁相关的研究和模型开发。
背景与挑战
背景概述
Depression Severity Levels Dataset 是一个专注于人类抑郁严重程度分类的聚合数据集,旨在支持多类分类模型的研究。该数据集由研究团队在2022年创建,主要应用于论文《HelaDepDet: A Novel Multi-Class Classification Model for Detecting the Severity of Human Depression》中,作为研究项目《The Correlation between Group Text Chat Behavior and Severity of Human Depression》的一部分。数据集基于BDI-3量表和抑郁严重程度注释框架(DSAS)进行标注,涵盖了从轻微到严重的四个抑郁等级。该数据集的发布为心理健康领域的研究提供了重要的数据支持,特别是在通过社交媒体文本分析抑郁严重程度方面具有显著影响力。
当前挑战
该数据集在解决抑郁严重程度分类问题时面临多重挑战。首先,抑郁症状的多样性和复杂性使得准确分类变得困难,尤其是在文本数据中捕捉情感细微变化时。其次,数据集的构建依赖于公开的语料库,数据质量和一致性可能受到影响,特别是在不同来源的数据整合过程中。此外,尽管使用了BDI-3和DSAS作为标注标准,但抑郁症状的主观性和个体差异可能导致标注偏差。最后,数据集中各类别的样本分布不均衡,可能影响模型的训练效果和泛化能力。这些挑战需要在后续研究中通过数据增强、标注优化和模型改进等手段加以解决。
常用场景
经典使用场景
Depression Severity Levels Dataset 主要用于心理健康领域的研究,特别是在抑郁症严重程度的自动分类任务中。该数据集通过结合BDI-3量表和抑郁症严重程度注释模式(DSAS),为研究者提供了一个标准化的工具,用于评估和分类抑郁症的严重程度。其经典使用场景包括在社交媒体文本分析中,通过自然语言处理技术识别用户的抑郁情绪及其严重程度,从而为心理健康监测提供数据支持。
衍生相关工作
该数据集衍生了一系列经典研究工作,特别是在抑郁症检测和分类领域。例如,基于该数据集的研究提出了多类分类模型HelaDepDet,用于检测抑郁症的严重程度。此外,该数据集还被用于开发基于社交媒体文本的抑郁症早期识别系统,相关研究成果发表在ACM Web Conference等顶级学术会议上,推动了抑郁症检测技术的进一步发展。
数据集最近研究
最新研究方向
近年来,随着心理健康问题的日益凸显,抑郁症的早期检测与严重程度分类成为研究热点。Depression Severity Levels Dataset作为一项基于BDI-3和DSAS标准的多类别分类数据集,为抑郁症严重程度的自动化检测提供了重要支持。该数据集结合了社交媒体文本行为分析,特别是通过HelaDepDet模型,探索了群体聊天行为与抑郁症严重程度之间的关联。前沿研究进一步利用Cha等人提出的抑郁症词典,增强了文本情感分析的准确性,为抑郁症的早期干预提供了新的技术路径。这一研究方向不仅推动了心理健康领域的智能化发展,也为社交媒体数据的深度挖掘开辟了新的应用场景。
以上内容由遇见数据集搜集并总结生成



