five

Emotional Audio-Textual Depression Corpus (EATD-Corpus)|抑郁症检测数据集|语音分析数据集

收藏
arXiv2022-02-15 更新2024-06-21 收录
抑郁症检测
语音分析
下载链接:
https://github.com/speechandlanguageprocessing/ICASSP2022-Depression
下载链接
链接失效反馈
资源简介:
EATD-Corpus是由同济大学创建的第一个包含中文音频和文本数据的开源抑郁症数据集,包含162名志愿者的音频和文本转录。数据集通过一个应用程序收集,志愿者需回答三个随机问题并完成SDS问卷。数据集的创建过程包括数据收集和预处理,确保音频和文本的质量。EATD-Corpus主要用于自动抑郁症检测研究,旨在通过分析语音特征和语言内容来提高抑郁症诊断的准确性。
提供机构:
同济大学软件工程学院
创建时间:
2022-02-15
AI搜集汇总
数据集介绍
main_image_url
构建方式
EATD-Corpus的构建分为两个步骤:数据收集和预处理。数据收集通过一个虚拟访谈应用程序进行,该程序会向受访者提出三个问题,并收集其音频回答。每个志愿者还需完成一份SDS问卷,以评估其抑郁严重程度。目前,已有162名志愿者完成了在线访谈。在预处理阶段,对收集到的音频进行了静音处理、去噪和转录,并手动校对了所有转录文本。
特点
EATD-Corpus的特点在于:1)它是第一个也是唯一一个公开的包含中文音频和文本数据的抑郁数据集;2)数据集包含了162名志愿者的音频回答和对应的文本转录;3)数据集的构建考虑了数据平衡问题,对抑郁类别的样本进行了扩充;4)提供了经过手动校对的文本转录,保证了数据质量。
使用方法
使用EATD-Corpus的方法包括:1)数据加载与预处理,将音频转换为梅尔频谱图,文本转换为句子嵌入;2)模型训练,采用GRU模型处理音频特征,BiLSTM模型处理文本特征,并通过多模态融合网络进行融合;3)性能评估,使用F1分数、召回率和精确率等指标对模型进行评估。
背景与挑战
背景概述
情绪识别是心理学和计算机科学领域中的一个重要研究方向,抑郁症的自动检测对于促进自我评估和改善诊断准确性具有重大意义。基于此,Ying Shen等研究人员构建了首个公开的包含音频和文本数据的中文抑郁症数据集EATD-Corpus,并提出了一种基于音频信号和语言内容分析的新型抑郁症检测方法。该方法不依赖于访谈中提出的问题内容,通过编码音频/文本特征为嵌入表示,实现了对抑郁症状态的检测。EATD-Corpus的创建,为抑郁症研究提供了宝贵的数据资源,有助于推动相关领域的研究进展。
当前挑战
在构建EATD-Corpus数据集的过程中,研究人员面临了多个挑战。首先,公开的抑郁症数据集非常稀缺,这限制了相关研究的深入进行。其次,构建过程中需要解决数据采集和预处理的问题,如确保音频质量、处理数据不平衡等。在模型构建方面,如何有效地融合音频和文本信息,提高抑郁症检测的准确性和泛化能力,也是一大挑战。
常用场景
经典使用场景
Emotional Audio-Textual Depression Corpus (EATD-Corpus) 是一个包含音频和文本数据的中国抑郁症公开数据集。该数据集的经典使用场景在于,研究人员可以利用它来训练和测试自动抑郁症检测模型,通过分析参与者的语音特征和语言内容来预测其抑郁状态。例如,可以基于该数据集开发一个智能助手,用户通过语音或文本与助手交流,助手根据交流内容判断用户是否可能患有抑郁症,并提供相应的建议或引导用户寻求专业帮助。
实际应用
在实际情况中,EATD-Corpus 可以应用于心理健康应用的开发,例如开发一个抑郁症自我评估的应用。用户可以录入自己的语音或文本,应用会根据这些输入判断用户的抑郁程度,并提供相应的反馈或建议。此外,该数据集也可以用于训练心理咨询师的辅助工具,帮助他们在诊断过程中更准确地识别抑郁症状。
衍生相关工作
基于 EATD-Corpus,衍生了多项相关工作。例如,研究人员开发了基于深度学习模型的抑郁症检测方法,这些方法可以更准确地识别抑郁状态。此外,也有工作专注于利用 EATD-Corpus 中的数据来研究抑郁症与语音特征之间的关系,以及如何结合音频和文本信息来提高抑郁症检测的准确性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Thyroid Disease Data

该数据集包含13个临床病理特征,旨在预测分化良好的甲状腺癌的复发。数据集收集了15年间的数据,每位患者至少被跟踪了10年。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录