Androids Depression Corpus

github2023-10-18 更新2024-05-31 收录

下载链接：

https://github.com/androidscorpus/data

下载链接

链接失效反馈

官方服务：

资源简介：

Androids Corpus是一个新的公开可用的基准，用于基于语音的抑郁症检测。该数据集包含多个音频文件，用于学术研究目的。

The Androids Corpus is a newly available public benchmark designed for speech-based depression detection. This dataset comprises multiple audio files intended for academic research purposes.

创建时间：

2023-05-30

原始信息汇总

数据集概述

数据集名称

Androids Depression Corpus

数据集描述

该数据集用于语音基础的抑郁症检测，详细描述可在以下论文中找到：
- Fuxiang Tao, Anna Esposito, and Alessandro Vinciarelli, "The Androids Corpus: A New Publicly Available Benchmark for Speech Based Depression Detection", Proceedings of Interspeech, 2023

数据集内容

Reading-Task 目录：包含112个音频文件，其中54个在子目录 "HC"（健康控制组）和58个在子目录 "PT"（患者组）。
Interview-Task/audio 目录：包含116个音频文件，其中52个在子目录 "HC" 和64个在子目录 "PT"。
Interview-Task/audio_clip 目录：包含874个音频文件，分布在116个子目录中，每个子目录对应一个参与访谈任务的说话者。
fold-list.csv：用于基线方法开发的5折交叉验证的文件列表。
Androids.conf：用于从音频文件中提取特征的OpenSMILE配置文件。
interview_timedata.csv：访谈任务音频数据的分割时间数据。

音频文件命名规则

格式：nn_XGmm_t.wav
- nn：唯一整数标识符，同一组中相同nn的文件包含同一说话者的声音。
- X：字母字符，表示说话者条件（P为抑郁症患者，C为控制组）。
- G：字母字符，表示说话者性别（M为男性，F为女性）。
- mm：两位整数，表示说话者年龄。
- t：整数，表示教育水平（1为小学，4为大学）。

数据集使用条款

仅限于学术研究（非商业）目的使用。
不得进一步分发数据集。
数据集不得在其他任何地方公开广播或发布。

联系方式

Fuxiang Tao: Fuxiang.Tao@glasgow.ac.uk
Anna Esposito: Anna.Esposito@unicampania.it
Alessandro Vinciarelli: Alessandro.Vinciarelli@glasgow.ac.uk

搜集汇总

数据集介绍

构建方式

Androids Depression Corpus的构建基于对参与者语音数据的系统性采集，涵盖了健康对照组（HC）和抑郁症患者组（PT）的语音样本。数据采集分为两个任务：阅读任务和访谈任务。阅读任务中，参与者朗读了伊索寓言《北风与太阳》；访谈任务则通过结构化访谈获取语音数据。所有音频文件均按照统一的命名规则进行标识，包含参与者编号、健康状况、性别、年龄和教育水平等信息，确保了数据的可追溯性和结构化。

特点

该数据集的特点在于其多样性和丰富性。数据集包含112个阅读任务音频文件和116个访谈任务音频文件，其中访谈任务进一步细分为874个音频片段。每个音频文件均附有详细的元数据，包括参与者的健康状况、性别、年龄和教育水平等。此外，数据集还提供了用于特征提取的OpenSMILE配置文件以及音频数据的分段信息，为研究者提供了多维度的分析基础。

使用方法

Androids Depression Corpus的使用方法主要围绕语音数据的特征提取和分析展开。研究者可通过提供的OpenSMILE配置文件提取音频特征，并结合fold-list.csv文件进行五折交叉验证，以评估抑郁症检测模型的性能。数据集的分段信息（interview_timedata.csv）可用于进一步分析语音的时序特征。使用该数据集时，需严格遵守非商业用途的限制，并确保数据不对外公开传播。

背景与挑战

背景概述

Androids Depression Corpus是由Fuxiang Tao、Anna Esposito和Alessandro Vinciarelli等研究人员于2023年创建的一个公开数据集，旨在为基于语音的抑郁症检测提供基准。该数据集收录了来自健康对照组和抑郁症患者的语音数据，涵盖了朗读任务和访谈任务两种情境下的音频记录。通过提供多样化的语音样本，该数据集为抑郁症的自动检测研究提供了重要的数据支持，推动了心理健康领域的技术进步。相关研究成果已在Interspeech 2023会议上发表，标志着其在语音分析和心理健康交叉领域的重要影响力。

当前挑战

Androids Depression Corpus在构建和应用过程中面临多重挑战。首先，抑郁症的语音特征提取和分类本身具有高度复杂性，语音信号中蕴含的情感信息往往较为隐晦，且易受个体差异和环境噪声的干扰。其次，数据集的构建需要严格遵循伦理规范，确保参与者的隐私和数据安全，这对数据的采集和标注提出了更高的要求。此外，数据集中包含的样本量相对有限，且抑郁症患者的语音数据分布不均，可能影响模型的泛化能力。如何从有限的语音数据中提取有效的抑郁症特征，并构建鲁棒的检测模型，是该领域亟待解决的核心问题。

常用场景

经典使用场景

Androids Depression Corpus 数据集在语音情感分析和心理健康研究领域具有重要应用。该数据集通过收集健康对照组和抑郁症患者的语音数据，为研究者提供了一个公开的基准，用于开发和测试基于语音的抑郁症检测算法。特别是在语音特征提取和情感识别任务中，该数据集为研究者提供了丰富的实验材料。

解决学术问题

Androids Depression Corpus 数据集解决了语音情感分析领域中的一个关键问题：如何通过非侵入性手段（如语音分析）进行抑郁症的早期检测。该数据集通过提供大量标注的语音样本，帮助研究者探索语音特征与心理健康状态之间的关联，推动了基于语音的抑郁症检测技术的发展，并为相关算法的性能评估提供了标准化的测试平台。

衍生相关工作

基于 Androids Depression Corpus 数据集，许多经典研究工作得以展开。例如，研究者利用该数据集开发了多种基于机器学习的抑郁症检测模型，探索了语音特征与心理健康状态之间的复杂关系。此外，该数据集还促进了跨学科合作，推动了语音处理技术与心理健康研究的深度融合，衍生出多项具有影响力的学术成果。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集