EATD-Corpus

github2023-07-10 更新2024-05-31 收录

下载链接：

https://github.com/speechandlanguageprocessing/ICASSP2022-Depression

下载链接

链接失效反馈

官方服务：

资源简介：

EATD-Corpus是一个包含162名接受咨询的志愿者的音频和文本文件的数据集。训练集包含来自83名志愿者的数据（19名抑郁和64名非抑郁），验证集包含来自79名志愿者的数据（11名抑郁和68名非抑郁）。每个文件夹包含一个志愿者的抑郁数据，包括原始音频、预处理音频、音频翻译和抑郁评分。

EATD-Corpus is a dataset containing audio and text files from 162 volunteers who participated in counseling sessions. The training set comprises data from 83 volunteers, among whom 19 are depressed and 64 are non-depressed. The validation set includes data from 79 volunteers, with 11 depressed and 68 non-depressed individuals. Each folder stores the depression-related data of one volunteer, which encompasses raw audio, preprocessed audio, audio transcripts, and depression rating scores.

创建时间：

2021-12-06

原始信息汇总

EATD-Corpus 数据集概述

数据集描述

EATD-Corpus 是一个包含音频和文本文件的数据集，由162名接受咨询的志愿者组成。

下载方式

数据集可以通过以下链接下载：下载链接密码：Ymj26Uv5

使用说明

数据集划分

训练集：包含83名志愿者的数据（19名抑郁者和64名非抑郁者）。
验证集：包含79名志愿者的数据（11名抑郁者和68名非抑郁者）。

文件结构

每个文件夹包含一名志愿者的抑郁数据，具体文件包括：

{positive/negative/neutral}.wav：原始音频文件。
{positive/negative/neutral}_out.wav：预处理后的音频文件，预处理操作包括降噪和去静音。
{positive/negative/neutral}.txt：音频翻译文本。
label.txt：原始SDS评分。
new_label.txt：标准化SDS评分（原始SDS评分乘以1.25）。

搜集汇总

数据集介绍

构建方式

EATD-Corpus数据集的构建基于162名接受心理咨询的志愿者，其数据包括音频和文本文件。这些文件通过采集志愿者的对话内容生成，涵盖了不同情绪状态下的音频记录及其对应的文本翻译。数据预处理步骤包括音频的去噪和去静音处理，以及文本的标准化处理，确保数据的质量和一致性。

特点

EATD-Corpus数据集的显著特点在于其多模态数据的整合，包括音频和文本两种形式，这为情感分析和抑郁症检测提供了丰富的信息源。此外，数据集的标签系统包括原始SDS评分和标准化后的SDS评分，这为研究者提供了不同层次的情感和心理状态评估工具。

使用方法

使用EATD-Corpus数据集时，研究者可以下载包含音频和文本文件的压缩包，并根据需要选择训练集或验证集。每个志愿者的数据被单独存储在一个文件夹中，包含原始和预处理后的音频文件、音频翻译文本以及相应的SDS评分。研究者可以通过提供的代码脚本提取特征并训练模型，如GRU或BiLSTM网络，以进行抑郁症的自动检测。

背景与挑战

背景概述

EATD-Corpus，作为ICASSP2022会议中提出的情感音频-文本语料库，由162名接受心理咨询的志愿者数据构成，旨在支持基于GRU/BiLSTM模型的自动抑郁症检测研究。该数据集的创建时间可追溯至2022年，主要研究人员通过IEEE和arXiv等平台发布了相关研究成果，展示了其在情感分析和心理健康评估领域的应用潜力。EATD-Corpus的核心研究问题聚焦于通过多模态数据融合技术，提升抑郁症检测的准确性和效率，对心理健康领域的研究具有重要推动作用。

当前挑战

EATD-Corpus在构建过程中面临多重挑战。首先，数据集的多样性和代表性问题，确保162名志愿者的数据能够全面反映抑郁症的多样症状，是一个关键挑战。其次，音频和文本数据的预处理，包括去噪和去静音等操作，需要精确的技术支持以保证数据质量。此外，多模态数据的融合模型训练，如何在音频和文本网络之间实现有效信息传递，以提升抑郁症检测的准确性，也是该数据集面临的重要技术难题。

常用场景

经典使用场景

在情感分析与心理健康研究领域，EATD-Corpus数据集以其独特的音频与文本双模态数据，成为自动抑郁症检测的经典工具。研究者通过该数据集，可以训练基于GRU/BiLSTM的深度学习模型，实现对抑郁症患者情感状态的精准识别。具体而言，数据集中的音频文件经过预处理，包括降噪和去静音，而文本文件则包含了音频的转录内容，这为多模态融合提供了坚实基础。

衍生相关工作

基于EATD-Corpus数据集，研究者们开展了多项相关工作，推动了情感分析和心理健康检测领域的发展。例如，有研究利用该数据集开发了基于多模态融合的抑郁症检测模型，显著提高了检测的准确率。此外，还有研究探讨了不同预处理方法对模型性能的影响，为数据预处理技术提供了新的见解。这些衍生工作不仅丰富了数据集的应用场景，也为后续研究提供了宝贵的参考。

数据集最近研究