EATD-Corpus

github2021-10-03 更新2024-05-31 收录

下载链接：

https://github.com/Fancy-Block/EATD-Corpus

下载链接

链接失效反馈

官方服务：

资源简介：

EATD-Corpus是一个包含162名接受咨询的志愿者的音频和文本文件的数据集。训练集包含83名志愿者（19名抑郁和64名非抑郁）的数据，验证集包含79名志愿者（11名抑郁和68名非抑郁）的数据。每个文件夹包含一名志愿者的抑郁数据，包括原始音频文件、预处理音频文件、音频翻译和抑郁评分。

The EATD-Corpus is a dataset comprising audio and text files from 162 volunteers who underwent counseling. The training set includes data from 83 volunteers (19 depressed and 64 non-depressed), while the validation set contains data from 79 volunteers (11 depressed and 68 non-depressed). Each folder contains the depression-related data of one volunteer, including original audio files, preprocessed audio files, audio transcriptions, and depression scores.

创建时间：

2021-10-03

原始信息汇总

EATD-Corpus 数据集概述

数据集组成

音频和文本文件：由162名接受咨询的志愿者提供。

数据集划分

训练集：包含83名志愿者的数据，其中19名为抑郁症患者，64名为非抑郁症患者。
验证集：包含79名志愿者的数据，其中11名为抑郁症患者，68名为非抑郁症患者。

文件结构

每个志愿者的文件夹包含以下内容：
- {positive/negative/neutral}.wav：原始音频文件（wav格式）。
- {positive/negative/neutral}_out.wav：预处理后的音频文件，包括降噪和去静音处理。
- {positive/negative/neutral}.txt：音频翻译文本。
- label.txt：原始SDS评分。
- new_label.txt：SDS评分乘以1.25后的结果。

搜集汇总

数据集介绍

构建方式

EATD-Corpus数据集构建基于162名接受心理咨询的志愿者的音频和文本文件。这些数据经过精心收集和整理，确保每一份数据都真实反映了志愿者的心理状态。数据集分为训练集和验证集，训练集包含83名志愿者的数据，其中19名为抑郁患者，64名为非抑郁者；验证集则包含79名志愿者的数据，其中11名为抑郁患者，68名为非抑郁者。每个志愿者的数据独立存储，确保了数据的完整性和独立性。

使用方法

使用EATD-Corpus数据集时，研究者可以通过分析音频和文本数据，结合SDS评分，深入探讨抑郁症状的表现和变化。训练集和验证集的划分便于模型的训练和验证，确保研究结果的可靠性。每个志愿者的数据独立存储，便于进行个体化分析。研究者可以利用预处理后的音频数据进行更精确的声学分析，同时结合文本数据进行多模态研究，从而全面理解抑郁症状的复杂性和多样性。

背景与挑战

背景概述

EATD-Corpus数据集由162名接受心理咨询的志愿者的音频和文本文件构成，旨在为心理健康领域的研究提供宝贵资源。该数据集由匿名研究团队于2022年创建，专注于抑郁症的早期识别与干预。通过结合音频情感分析和文本翻译，EATD-Corpus为研究人员提供了一个多模态数据平台，用于探索抑郁症患者的语言和情感特征。该数据集在心理健康研究领域具有重要影响力，特别是在情感计算和自然语言处理的交叉领域，为开发基于人工智能的抑郁症诊断工具奠定了基础。

当前挑战

EATD-Corpus数据集在解决抑郁症早期识别问题时面临多重挑战。首先，抑郁症的临床表现复杂多样，如何从音频和文本数据中准确提取情感特征是一个关键难题。其次，数据集的样本量相对较小，且抑郁症患者与非患者的比例不平衡，可能导致模型训练中的偏差问题。在构建过程中，研究团队还面临数据预处理的技术挑战，例如音频降噪和去静音处理，以确保数据质量。此外，文本翻译的准确性和情感标注的一致性也对数据集的可靠性提出了更高要求。这些挑战需要通过更先进的算法和更大规模的数据集来逐步克服。

常用场景

经典使用场景

EATD-Corpus数据集在心理健康研究领域具有重要应用，特别是在抑郁症的早期检测和诊断中。该数据集通过收集162名志愿者的音频和文本数据，为研究人员提供了一个丰富的资源库，用于分析和识别抑郁症患者的语音特征和情感表达。通过对比抑郁与非抑郁个体的语音数据，研究者能够深入探讨抑郁症在语音模式上的具体表现，从而为临床诊断提供科学依据。

解决学术问题

EATD-Corpus数据集解决了抑郁症研究中数据稀缺和多样性不足的问题。传统的抑郁症研究往往依赖于小样本或单一类型的数据，限制了研究的广度和深度。该数据集通过提供大规模的音频和文本数据，并结合SDS评分，使得研究者能够更全面地分析抑郁症的语音特征和情感变化。这不仅推动了抑郁症的早期检测技术的发展，还为个性化治疗方案的制定提供了数据支持。

实际应用

在实际应用中，EATD-Corpus数据集被广泛用于开发智能心理健康监测系统。通过分析患者的语音数据，系统能够实时监测情绪变化，并提供早期预警。这种技术特别适用于远程医疗和心理健康管理，帮助医生和心理咨询师更高效地识别和干预潜在的心理健康问题。此外，该数据集还可用于训练机器学习模型，提升抑郁症诊断的准确性和效率。

数据集最近研究