CREMA, RAVDESS, SAVEE, TESS|情感识别数据集|语音数据数据集
收藏语音情感识别数据集
数据集
该项目使用的数据集包括:
- CREMA: 包含标记有悲伤、愤怒、厌恶、恐惧、快乐和中性情感的音频文件。
- RAVDESS: 包含标记有中性、快乐、悲伤、愤怒、恐惧、厌恶和惊讶情感的音频文件。
- SAVEE: 包含标记有各种情感的音频文件。
- TESS: 包含标记有各种情感的音频文件。
功能
- 从CREMA、RAVDESS、SAVEE和TESS数据集中加载和预处理数据。
- 使用
librosa
进行特征提取。 - 使用
TensorFlow
和Keras
进行模型训练。 - 使用混淆矩阵和分类报告进行评估。
模型架构
模型使用TensorFlow
和Keras
构建,包括:
- 用于特征提取的卷积层。
- 用于分类的密集层。
- 用于正则化的Dropout层。
训练
模型训练包括:
- 使用早停法避免过拟合。
- 在平台期减少学习率以动态调整学习率。
- 保存训练过程中的最佳模型。
评估
评估使用:
- 混淆矩阵以可视化性能。
- 分类报告以提供精确度、召回率和F1分数。

中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
FEVER
FEVER(Fact Extraction and VERification)数据集是一个用于事实验证任务的数据集,包含超过185,000个标注的声明,这些声明需要从维基百科中提取证据进行验证。数据集的目标是帮助开发和评估自动事实验证系统。
fever.ai 收录
PROSLU
PROSLU数据集是由哈尔滨工业大学社会计算与信息检索研究中心和华为技术有限公司共同创建的,包含超过5000条中文语句,每条语句都配有详细的个人资料信息,如知识图谱、用户资料和上下文感知信息。数据集通过人工标注确保高质量,旨在解决在语义模糊的实际场景中,传统基于文本的口语理解模型可能无法准确识别意图和槽位的问题。该数据集的应用领域主要集中在提高对话系统在复杂环境下的理解和响应能力,特别是在用户意图不明确或语句具有多重含义的情况下。
arXiv 收录
Cifar-100
Cifar-100数据集包含100个类别的60000张32x32彩色图像,每个类别有600张图像。这些类别被分为20个超类,每个超类包含5个子类。数据集分为50000张训练图像和10000张测试图像。
www.cs.toronto.edu 收录
UAV123
从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。
OpenDataLab 收录