RAVDESS Dataset|情感识别数据集|语音分析数据集
收藏语音情感识别使用CNN与RAVDESS数据集
概述
该项目使用卷积神经网络(CNN)对RAVDESS数据集中的语音进行情感分类。目标是准确识别音频记录中的快乐、悲伤、愤怒、恐惧、厌恶、惊讶和中性等情感。该技术可应用于人机交互、心理健康监测和客户服务自动化等领域。
数据集
- 来源: RAVDESS Dataset
- 内容: 24名演员(12男12女)表演7种情感(平静、快乐、悲伤、愤怒、恐惧、厌恶、惊讶)和一个中性表达。每种情感由24个音频文件表示。
特征
- 数据预处理: 音频文件加载、梅尔频率倒谱系数(MFCCs)提取和数据增强。
- 模型架构: 自定义CNN模型,包含卷积层、池化层和密集层。
- 训练与评估: 使用Keras和TensorFlow后端,包括早停法、学习率调整和准确率、精确率、召回率和F1分数等评估指标。

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
World Bank Open Data
World Bank Open Data 是一个包含全球经济、社会和环境指标的开放数据集。它提供了来自世界银行和其他国际组织的数据,涵盖了多个主题,如人口统计、教育、健康、金融、环境等。数据集包括时间序列数据和地理空间数据,支持全球范围内的分析和研究。
data.worldbank.org 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
QM9
QM9数据集包含134k个有机小分子化合物的量子化学计算结果,涵盖了12个量子化学性质,如分子能量、电离能、电子亲和能等。
quantum-machine.org 收录
simon3000/genshin-voice
Genshin Voice数据集包含来自热门游戏《原神》的语音台词,涵盖多种语言(中文、英文、日文、韩文)。这些语音台词由游戏中的角色说出,内容广泛,包括问候、战斗和故事对话等。数据集包含音频、转录文本、语言、说话者、说话者类型、类型和游戏内文件名等特征。
hugging_face 收录