Androids Depression Corpus
收藏github2023-10-18 更新2024-05-31 收录
下载链接:
https://github.com/androidscorpus/data
下载链接
链接失效反馈官方服务:
资源简介:
Androids Corpus是一个新的公开可用的基准,用于基于语音的抑郁症检测。该数据集包含多个音频文件,用于学术研究目的。
The Androids Corpus is a newly available public benchmark designed for speech-based depression detection. This dataset comprises multiple audio files intended for academic research purposes.
创建时间:
2023-05-30
原始信息汇总
数据集概述
数据集名称
- Androids Depression Corpus
数据集描述
- 该数据集用于语音基础的抑郁症检测,详细描述可在以下论文中找到:
- Fuxiang Tao, Anna Esposito, and Alessandro Vinciarelli, "The Androids Corpus: A New Publicly Available Benchmark for Speech Based Depression Detection", Proceedings of Interspeech, 2023
数据集内容
- Reading-Task 目录:包含112个音频文件,其中54个在子目录 "HC"(健康控制组)和58个在子目录 "PT"(患者组)。
- Interview-Task/audio 目录:包含116个音频文件,其中52个在子目录 "HC" 和64个在子目录 "PT"。
- Interview-Task/audio_clip 目录:包含874个音频文件,分布在116个子目录中,每个子目录对应一个参与访谈任务的说话者。
- fold-list.csv:用于基线方法开发的5折交叉验证的文件列表。
- Androids.conf:用于从音频文件中提取特征的OpenSMILE配置文件。
- interview_timedata.csv:访谈任务音频数据的分割时间数据。
音频文件命名规则
- 格式:
nn_XGmm_t.wavnn:唯一整数标识符,同一组中相同nn的文件包含同一说话者的声音。X:字母字符,表示说话者条件(P为抑郁症患者,C为控制组)。G:字母字符,表示说话者性别(M为男性,F为女性)。mm:两位整数,表示说话者年龄。t:整数,表示教育水平(1为小学,4为大学)。
数据集使用条款
- 仅限于学术研究(非商业)目的使用。
- 不得进一步分发数据集。
- 数据集不得在其他任何地方公开广播或发布。
联系方式
- Fuxiang Tao: Fuxiang.Tao@glasgow.ac.uk
- Anna Esposito: Anna.Esposito@unicampania.it
- Alessandro Vinciarelli: Alessandro.Vinciarelli@glasgow.ac.uk
搜集汇总
数据集介绍

构建方式
Androids Depression Corpus的构建基于对参与者语音数据的系统性采集,涵盖了健康对照组(HC)和抑郁症患者组(PT)的语音样本。数据采集分为两个任务:阅读任务和访谈任务。阅读任务中,参与者朗读了伊索寓言《北风与太阳》;访谈任务则通过结构化访谈获取语音数据。所有音频文件均按照统一的命名规则进行标识,包含参与者编号、健康状况、性别、年龄和教育水平等信息,确保了数据的可追溯性和结构化。
特点
该数据集的特点在于其多样性和丰富性。数据集包含112个阅读任务音频文件和116个访谈任务音频文件,其中访谈任务进一步细分为874个音频片段。每个音频文件均附有详细的元数据,包括参与者的健康状况、性别、年龄和教育水平等。此外,数据集还提供了用于特征提取的OpenSMILE配置文件以及音频数据的分段信息,为研究者提供了多维度的分析基础。
使用方法
Androids Depression Corpus的使用方法主要围绕语音数据的特征提取和分析展开。研究者可通过提供的OpenSMILE配置文件提取音频特征,并结合fold-list.csv文件进行五折交叉验证,以评估抑郁症检测模型的性能。数据集的分段信息(interview_timedata.csv)可用于进一步分析语音的时序特征。使用该数据集时,需严格遵守非商业用途的限制,并确保数据不对外公开传播。
背景与挑战
背景概述
Androids Depression Corpus是由Fuxiang Tao、Anna Esposito和Alessandro Vinciarelli等研究人员于2023年创建的一个公开数据集,旨在为基于语音的抑郁症检测提供基准。该数据集收录了来自健康对照组和抑郁症患者的语音数据,涵盖了朗读任务和访谈任务两种情境下的音频记录。通过提供多样化的语音样本,该数据集为抑郁症的自动检测研究提供了重要的数据支持,推动了心理健康领域的技术进步。相关研究成果已在Interspeech 2023会议上发表,标志着其在语音分析和心理健康交叉领域的重要影响力。
当前挑战
Androids Depression Corpus在构建和应用过程中面临多重挑战。首先,抑郁症的语音特征提取和分类本身具有高度复杂性,语音信号中蕴含的情感信息往往较为隐晦,且易受个体差异和环境噪声的干扰。其次,数据集的构建需要严格遵循伦理规范,确保参与者的隐私和数据安全,这对数据的采集和标注提出了更高的要求。此外,数据集中包含的样本量相对有限,且抑郁症患者的语音数据分布不均,可能影响模型的泛化能力。如何从有限的语音数据中提取有效的抑郁症特征,并构建鲁棒的检测模型,是该领域亟待解决的核心问题。
常用场景
经典使用场景
Androids Depression Corpus 数据集在语音情感分析和心理健康研究领域具有重要应用。该数据集通过收集健康对照组和抑郁症患者的语音数据,为研究者提供了一个公开的基准,用于开发和测试基于语音的抑郁症检测算法。特别是在语音特征提取和情感识别任务中,该数据集为研究者提供了丰富的实验材料。
解决学术问题
Androids Depression Corpus 数据集解决了语音情感分析领域中的一个关键问题:如何通过非侵入性手段(如语音分析)进行抑郁症的早期检测。该数据集通过提供大量标注的语音样本,帮助研究者探索语音特征与心理健康状态之间的关联,推动了基于语音的抑郁症检测技术的发展,并为相关算法的性能评估提供了标准化的测试平台。
衍生相关工作
基于 Androids Depression Corpus 数据集,许多经典研究工作得以展开。例如,研究者利用该数据集开发了多种基于机器学习的抑郁症检测模型,探索了语音特征与心理健康状态之间的复杂关系。此外,该数据集还促进了跨学科合作,推动了语音处理技术与心理健康研究的深度融合,衍生出多项具有影响力的学术成果。
以上内容由遇见数据集搜集并总结生成



