VATE
收藏VATE 数据集概述
概览
VATE 是一个用于情感评估的视频-音频-文本多模态数据集。该数据集收集了多种自发人类情感状态的多模态数据,包含 21,871 个原始视频以及来自多个情感诱发访谈的语音记录和文本转录。VATE 专门设计用于人类情感状态的对比自监督表示学习,优先考虑数据的数量和质量,而不是情感的人工标注,后者在现代情感计算中往往是主观、不一致和有争议的。为了突出我们提案的实用性,我们发布了一个采用对比视频-语言-音频预训练程序的多模态编码器,该程序在 VATE 数据集上进行。实验结果表明,与不同下游任务上的完全监督基线相比,该模型展现出更好的少样本泛化能力。
数据集的概览可以在以下路径找到:
sh VATE/output/VATE/metadata.json
仓库结构
sh └── VATE/ ├── VATE.py ├── README.md ├── audio.py ├── contrastive_model.py ├── dataset.py ├── dataset_utils.py ├── feature_extraction │ ├── VATE │ ├── collect_yb.py │ ├── couples.txt │ ├── cut_video.py │ ├── input.txt │ ├── main.py │ └── write_video.py ├── main.py ├── media.py ├── output │ └── VATE │ ├── best_model_contrastive.pt │ └── metadata.json ├── text.py ├── train_test.py ├── utils.py └── video.py
入门指南
安装
- 克隆 VATE 仓库:
sh git clone https://github.com/FrancescoAgnelli3/VATE
- 切换到项目目录:
sh cd VATE
- 安装依赖项:
sh pip install -r requirements.txt
下载 VATE
使用以下命令下载 VATE 数据集:
- 切换到项目目录:
sh cd feature_extraction
- 下载数据集:
sh python main.py
数据集将下载到以下文件夹:
sh VATE/feature_extraction/VATE
如果你想添加其他 YouTube 播放列表到数据集,可以将其添加到 Python 文件并运行:
sh python collect_yb.py
然后再次运行:
sh python main.py
对比模型
- 在数据集上训练对比模型,切换到项目目录:
sh cd ..
- 训练模型:
sh python main.py
- 模型将保存在以下文件夹(或可以直接下载已预训练的模型):
sh VATE/output/VATE/best_model_contrastive.pt
贡献
要为项目做出贡献,请遵循以下指南:
-
fork 仓库并将其克隆到本地机器。
-
为你的功能或错误修复创建一个新分支。
-
进行更改并提交它们,并附上描述性的提交消息。
-
将你的分支推送到你 fork 的仓库。
-
向主仓库提交拉取请求。
许可证
该项目受 MIT LICENSE 许可证保护。




