five

MPDD-Elderly; MPDD-Young|心理健康数据集|抑郁检测数据集

收藏
arXiv2025-05-15 更新2025-05-17 收录
心理健康
抑郁检测
下载链接:
https://hacilab.github.io/MPDDChallenge.github.io
下载链接
链接失效反馈
资源简介:
MPDD数据集是一个多模态数据集,旨在通过整合音频和视频数据,以及个人差异因素,来检测不同人群中的抑郁表现。该数据集分为两个子集:MPDD-Young和MPDD-Elderly,分别针对年轻人和老年人。数据集内容丰富,包含基于PHQ-9量表、五大人格特质和一系列人口统计数据的标注信息,以及通过半结构化访谈收集的音频和视频数据。数据集的创建过程严谨,包括问卷调查、自我介绍和受控文本阅读任务等。MPDD数据集的应用领域主要是心理健康研究,旨在推动更个性化和精确的抑郁检测方法的发展。
提供机构:
东北大学
创建时间:
2025-05-15
AI搜集汇总
数据集介绍
main_image_url
构建方式
MPDD-Elderly和MPDD-Young数据集的构建采用了多模态数据采集方法,结合了半结构化访谈(SSI)和标准化心理评估工具。针对老年人群,数据采集在中国某医院进行,特别关注患有基础疾病的老年人,通过便携式摄像头记录面部表情和音频,同时使用HAMD-24和PHQ-9量表评估抑郁程度,BigFive-10量表评估人格特质。年轻人群的数据采集则包括问卷调查、自我介绍环节和文本阅读任务,同样通过摄像头和麦克风记录面部表情和语音。两个子集均严格遵循伦理审查流程,确保参与者知情同意。
特点
MPDD数据集的核心特点在于其多模态性和个性化标注的深度结合。数据集不仅包含音频和视频数据,还整合了PHQ-9抑郁评分、大五人格特质及人口统计学信息,支持二元、三元和五元分类任务。MPDD-Elderly子集进一步标注了健康状况、经济压力等上下文信息,MPDD-Young子集则包含年龄、性别等人口学变量。与现有数据集相比,MPDD通过年龄分层(老年/青年)和个体差异标注,显著提升了抑郁表达的细粒度分析能力,如表1所示其标注维度超越同类数据集。
使用方法
数据集的使用需遵循多模态融合分析框架。基线模型采用LSTM架构分别处理音频(MFCC/OpenSMILE/Wav2Vec)和视频特征(DenseNet/OpenFace/ResNet),通过Transformer网络融合模态信息,并拼接个性化特征嵌入(如ChatGLM3生成的人格描述文本的RoBERTa编码)。数据按参与者ID划分训练集(90%)和验证集(10%),避免数据泄漏。研究者可通过官方仓库获取预提取特征或原始数据,支持1秒/5秒时间窗分析,适用于抑郁严重程度分类、跨年龄群体比较等研究场景。
背景与挑战
背景概述
MPDD-Elderly和MPDD-Young数据集由东北大学等机构的研究团队于2025年提出,旨在解决心理健康领域中抑郁症检测的年龄差异和个体多样性问题。该数据集通过整合音频、视频模态数据及人格特质等个体差异因素,填补了现有研究主要关注年轻成年人而忽视其他年龄段的空白。其创新性在于采用半结构化访谈和标准化量表(如PHQ-9、HAMD-24和BigFive-10)进行多维度标注,支持从二元到五元的分类任务,为个性化抑郁症检测提供了首个跨年龄段的基准资源。
当前挑战
该数据集面临的核心挑战包括:1) 领域问题层面,需解决抑郁症表现随年龄和人格特质产生的异质性,例如老年群体因慢性疾病导致的症状混淆,以及年轻群体非临床样本的细微特征捕捉;2) 构建过程中需克服多模态数据同步对齐、隐私伦理审查(如医院环境下的患者数据采集),以及跨文化背景下量表效度验证等难题。此外,个性化特征与多模态数据的有效融合仍存在模型可解释性不足的技术瓶颈。
常用场景
经典使用场景
MPDD-Elderly和MPDD-Young数据集在心理健康研究领域具有重要应用价值,尤其在抑郁症检测方面。这些数据集通过整合音频、视频数据以及个体差异信息(如人格特质和人口统计学特征),为研究人员提供了丰富的多模态数据资源。经典使用场景包括基于多模态数据的抑郁症自动检测模型开发,以及针对不同年龄群体的个性化抑郁症状分析。这些数据集特别适用于探索年龄因素在抑郁表现中的差异,为跨年龄段心理健康研究提供了重要数据支持。
实际应用
在实际应用层面,MPDD数据集为心理健康服务的智能化发展提供了重要支持。基于该数据集开发的检测模型可应用于临床辅助诊断,帮助医生更客观地评估患者抑郁状态。在社区心理健康筛查中,相关技术可实现大规模人群的初步抑郁风险评估。特别值得注意的是,针对老年人群的MPDD-Elderly子集,为养老机构和医疗机构提供了专门针对老年抑郁的检测工具开发基础,这对于改善老年心理健康服务具有重要意义。
衍生相关工作
MPDD数据集已经衍生出多个有影响力的研究方向。在算法层面,基于该数据集的多模态融合方法和个性化特征建模技术得到了显著发展。在应用研究方面,该数据集促进了针对特定人群(如慢性病患者、经济压力人群)的抑郁风险预测研究。此外,数据集提供的丰富标注信息还推动了抑郁症与人格特质关联性研究的发展。相关研究成果已在情感计算、心理健康信息学等领域产生广泛影响,为后续更精细化的抑郁检测研究奠定了基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

YOLO-dataset

该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。

github 收录