AdoDAS Dataset

github2026-03-30 更新2026-03-31 收录

下载链接：

https://github.com/jeremychee4/AdoDASdataset

下载链接

链接失效反馈

官方服务：

资源简介：

AdoDAS是一个大规模多模态数据集，专为青少年抑郁、焦虑和压力（D/A/S）的自动化评估而设计。该数据集强调道德数据共享和未成年人隐私保护，不发布原始音频或视频记录，而是提供匿名化的潜在表示和时间元数据，以实现可重复的多模态研究而不暴露可识别信息。数据集包含6,000名青少年的24,000个音频-视频片段，涵盖视觉、声学和时间元数据（VAD对齐），并标注了DASS-21（抑郁/焦虑/压力）数据。

AdoDAS is a large-scale multimodal dataset specifically designed for the automated assessment of adolescent depression, anxiety, and stress (D/A/S). This dataset emphasizes ethical data sharing and privacy protection for minors; instead of releasing raw audio or video recordings, it provides anonymized latent representations and temporal metadata to enable reproducible multimodal research without exposing identifiable information. The dataset contains 24,000 audio-visual clips from 6,000 adolescents, covering visual, acoustic, and temporal metadata (VAD-aligned), and is annotated with DASS-21 (depression/anxiety/stress) data.

创建时间：

2026-03-29

原始信息汇总

AdoDAS 数据集概述

数据集简介

AdoDAS 是一个用于青少年抑郁、焦虑和压力（D/A/S）自动化评估的大规模多模态数据集。该数据集强调伦理数据共享和对未成年人的隐私保护，不发布原始音频或视频记录，而是提供匿名化的潜在表征和时间元数据。

数据集摘要

参与者：6,000 名青少年
数据段：24,000 个音视频片段
模态：
- 视觉
- 声学
- 时间元数据：VAD 对齐
标注：DASS-21（抑郁/焦虑/压力）
任务：
- 多任务二元 D/A/S 筛查
- DASS-21 项目级预测
数据划分：官方受试者不相交的训练/验证/测试划分（70%:10%:20%）

数据访问

训练集：https://drive.google.com/drive/folders/1OyjFeAlYFDYKcFtL_232rDSHTeEpVGQe?usp=sharing

验证集：https://drive.google.com/drive/folders/1io1O2hOhvM-OpG7mFssuKsVzRK-F5lN7?usp=sharing

访问步骤：

下载 AdoDAS 数据集许可协议 PDF：用户许可协议（必须由全职教职员工或研究人员签署）。
仔细审阅协议。
手动签署协议并填写所有必填字段。
将签署的协议通过电子邮件提交至：k3nwong@seu.edu.cn，并抄送 qitianhua@seu.edu.cn 和 luozhaojie@seu.edu.cn。

访问限制：仅限学术研究，且需同意数据集许可和伦理使用条款。

基线方法

该仓库提供：

基于潜在特征的基线实现
官方任务定义和评估指标
用于可重复训练和评估的脚本

搜集汇总

数据集介绍

构建方式

在青少年心理健康评估领域，AdoDAS数据集通过严谨的伦理框架构建而成。研究团队采集了6000名青少年的多模态数据，形成了24000个音视频片段。为保护未成年人隐私，原始音频与视频记录均未公开，取而代之的是经过匿名化处理的潜在表征与时间元数据，如语音活动检测对齐信息。所有数据均标注了基于DASS-21量表的抑郁、焦虑和压力评分，并按照70%:10%:20%的比例划分了受试者不相交的训练集、验证集和测试集，确保了评估的客观性。

特点

该数据集的核心特点在于其大规模与隐私保护的平衡设计。作为专为青少年心理健康筛查构建的资源，它涵盖了视觉、声学及时间序列等多模态信息，支持抑郁、焦虑和压力的多任务二元筛查以及DASS-21项目级预测任务。数据集通过提供匿名化潜在特征而非原始媒体，在促进可重复研究的同时，严格遵循了未成年人数据保护准则，为数字安全设定了新标准。其官方划分的数据分割方案进一步保障了模型评估的严谨性与泛化能力。

使用方法

研究人员可通过指定链接获取训练集与验证集，但使用前需完成严格的访问流程。用户必须下载并仔细阅读数据集许可协议，由全职教职人员或研究者手写签署后，通过电子邮件提交至指定地址。数据集仅限学术研究用途，使用者需严格遵守许可协议中的伦理条款与使用限制。获得访问权限后，可基于提供的潜在特征与基线实现，开展多模态心理健康评估模型的训练与评估，利用官方任务定义与指标确保研究的可复现性。

背景与挑战

背景概述

在心理健康研究领域，青少年抑郁、焦虑和压力（D/A/S）的早期识别与评估一直是学术界关注的焦点。AdoDAS数据集由东南大学等机构的研究团队于近年创建，旨在通过大规模多模态数据推动自动化心理评估技术的发展。该数据集以六千名青少年为样本，融合视觉、声学及时间元数据，并标注DASS-21量表分数，核心研究问题在于探索如何利用多模态信号实现精准、非侵入式的心理状态筛查。其创新性在于严格遵循隐私保护原则，仅提供匿名化潜在表征，为青少年心理健康研究设立了新的数据伦理标准，对计算精神病学与多媒体分析领域产生了重要影响。

当前挑战

AdoDAS数据集所针对的心理健康评估任务面临多重挑战：在领域问题层面，抑郁、焦虑和压力作为内在心理状态，其外部表现具有高度个体差异性与情境依赖性，如何从多模态信号中提取稳健且可泛化的特征是一大难点；同时，青少年群体的心理表达往往更为隐晦，模型需克服标注噪声与数据不平衡问题。在构建过程中，挑战集中于伦理与隐私保护：为确保未成年人数字安全，研究团队必须设计复杂的匿名化流程，将原始音视频转换为潜在表征，这既增加了数据预处理的技术复杂度，也使得后续模型可解释性研究受到限制；此外，跨机构协作下的数据合规采集与严格访问控制机制，亦对数据集的可及性与推广构成挑战。

常用场景

经典使用场景

在青少年心理健康评估领域，AdoDAS数据集为多模态机器学习研究提供了经典范例。该数据集通过视觉、声学及时间元数据等多模态特征，支持对抑郁、焦虑和压力症状的自动化筛查。研究者通常利用其提供的匿名化潜在表示，构建端到端的分类模型，以完成多任务二元分类或DASS-21项目级预测任务，从而在严格保护隐私的前提下推动心理健康检测技术的发展。

衍生相关工作

围绕AdoDAS数据集，学术界已衍生出一系列关注多模态融合与隐私保护的研究工作。例如，研究者探索了基于潜在表示的跨模态注意力机制，以提升症状识别的准确性；同时，也有工作致力于开发联邦学习框架，在分布式训练中进一步强化数据隐私。这些进展不仅推动了心理健康计算领域的方法创新，也为其他敏感医疗数据的合规使用提供了重要参考。

数据集最近研究