five

语音情绪识别

收藏
阿里云天池2026-06-03 更新2025-04-19 收录
下载链接:
https://tianchi.aliyun.com/dataset/201708
下载链接
链接失效反馈
官方服务:
资源简介:
CASIA语音情绪识别数据集是由中国科学院自动化研究所创建的中文语音数据集,专门用于情绪识别研究。该数据集包含了六种基本情绪:愤怒(angry)、恐惧(fear)、高兴(happy)、中性(neutral)、悲伤(sad)和惊讶(surprise)。每个情绪类别下都有相应的语音样本,文件格式为WAV。 数据集结构 数据集中的语音文件以WAV格式存储,文件命名格式为:201-angry-liuchanhg.wav。其中: 201 表示文件编号。 angry 表示情绪类别。 liuchanhg 表示说话者姓名。 使用说明 下载数据集:您可以通过本仓库的下载链接获取完整的CASIA语音情绪识别数据集。 数据预处理:在使用数据集进行情绪识别模型的训练或测试之前,建议对语音数据进行预处理,例如特征提取、标准化等。 模型训练:使用该数据集可以训练各种情绪识别模型,如基于深度学习的模型(如CNN、RNN、LSTM等)或其他传统机器学习模型。 评估与测试:在模型训练完成后,可以使用数据集中的部分数据进行模型评估和测试,以验证模型的性能。

CASIA Speech Emotion Recognition Dataset is a Chinese speech dataset developed by the Institute of Automation, Chinese Academy of Sciences, exclusively for emotion recognition research. This dataset contains six basic emotions: angry, fear, happy, neutral, sad, and surprise. Each emotion category has corresponding speech samples stored in WAV format. Dataset Structure The speech files in the dataset are stored in WAV format following the naming convention: 201-angry-liuchanhg.wav. The components of the filename are explained as follows: - 201: File number - angry: Emotion category - liuchanhg: Speaker's name Usage Instructions 1. Download the dataset: You can obtain the complete CASIA Speech Emotion Recognition Dataset via the download links provided in this repository. 2. Data Preprocessing: Before training or testing emotion recognition models using this dataset, it is recommended to preprocess the speech data, such as feature extraction, standardization, etc. 3. Model Training: This dataset can be used to train various emotion recognition models, including deep learning-based models (e.g., CNN, RNN, LSTM, etc.) and other traditional machine learning models. 4. Evaluation and Testing: After completing model training, you can use a portion of the data in the dataset for model evaluation and testing to verify the model's performance.
提供机构:
阿里云天池
创建时间:
2025-04-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是CASIA语音情绪识别数据集,由中国科学院自动化研究所创建,专门用于中文语音情绪识别研究。它包含六种基本情绪(愤怒、恐惧、高兴、中性、悲伤、惊讶)的WAV格式语音样本,文件命名规范(编号-情绪类别-说话者姓名),便于数据预处理和模型训练。数据集大小为54.88MB,适用于基于深度学习或传统机器学习的情绪识别任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务