Chinese Speech Emotion Datasets

github2024-04-15 更新2024-05-31 收录

下载链接：

https://github.com/artmusic0/Chinese-Speech-Emotion-Datasets

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含传统中文（台湾）的语音数据及其转换的频谱图。数据由一些研究生朋友收集，部分来自YouTube视频剪辑，并分为三个类别：正面、自然和负面。

This dataset comprises speech data in Traditional Chinese (Taiwan) along with their corresponding spectrograms. The data was collected by a group of graduate student friends, partially sourced from YouTube video clips, and categorized into three classes: positive, neutral, and negative.

创建时间：

2017-08-10

原始信息汇总

中文语音情感数据集概述

数据集描述

本数据集包含传统中文（台湾）的语音数据及其转换的频谱图。数据由一些研究生朋友收集，部分来自YouTube视频剪辑，并分为三个类别。

数据集详情

类别分布

类别	正面	中性	负面
总数	218	214	220
训练集	200	200	200
测试集	18	14	20

测试数据是从所有总数数据中随机选取的。

搜集汇总

数据集介绍

构建方式

该数据集的构建基于传统中文（台湾）语音数据，涵盖了从实际录音和YouTube视频中剪辑的语音片段。这些数据被转换为频谱图，并被分类为三种情感类别：积极、自然和消极。训练集和测试集的划分遵循均衡分布，确保每类情感在训练和测试数据中均有合理的比例。测试数据是从总数中随机抽取的，以确保数据的随机性和代表性。

特点

该数据集的主要特点在于其情感分类的多样性和数据的均衡分布。每种情感类别均包含约200条训练数据和少量测试数据，确保了模型训练和评估的可靠性。此外，数据集中的语音数据被转换为频谱图，这为基于图像的深度学习模型提供了便利，尤其是在处理语音情感识别任务时。

使用方法

使用该数据集时，用户可以将其用于训练和评估语音情感识别模型。数据集提供了训练集和测试集的划分，用户可以直接加载这些数据进行模型训练和验证。建议在使用时引用相关文献，以确保学术诚信和数据来源的透明性。该数据集适用于基于深度学习的语音情感分析研究，尤其是那些依赖于频谱图特征的模型。

背景与挑战

背景概述

Chinese Speech Emotion Datasets是由一群研究生朋友收集并整理的语音情感数据集，主要包含来自台湾地区的传统中文语音数据，并转换为频谱图形式。该数据集分为三类情感：积极、自然和消极，每类情感包含218、214和220条语音数据。数据集的构建旨在支持情感识别领域的研究，特别是基于深度学习的语音情感分析。该数据集的创建时间可追溯至2017年，主要研究人员包括李明哲、叶圣成、邱圣宇和张家玮，他们的研究成果发表于MMSys'17会议，展示了基于深度卷积神经网络的虚拟老年人伴侣代理系统。该数据集对语音情感识别领域的研究具有重要影响，为相关算法提供了宝贵的实验数据。

当前挑战

Chinese Speech Emotion Datasets在构建过程中面临多项挑战。首先，语音数据的收集和分类需要精确的情感标注，确保数据的情感标签准确无误。其次，数据集的多样性也是一个挑战，如何从不同来源（如YouTube视频）获取多样化的语音样本，以确保模型能够泛化到各种语音情境。此外，数据集的平衡性也是一个关键问题，尽管数据集在各类情感上的分布相对均衡，但仍需进一步优化以减少类别不平衡带来的影响。最后，数据集的隐私和版权问题也需要谨慎处理，确保所有数据的合法性和合规性。

常用场景

经典使用场景

Chinese Speech Emotion Datasets 数据集在情感分析领域具有显著的应用价值。该数据集通过收集和分类来自台湾地区的语音数据，涵盖了正面、自然和负面三种情感类别，为研究者提供了一个标准化的情感语音数据库。其经典使用场景包括情感识别模型的训练与验证，尤其是在自然语言处理和语音识别技术中，该数据集为构建高精度的情感分类系统提供了坚实的基础。

衍生相关工作

基于 Chinese Speech Emotion Datasets 数据集，研究者们开展了多项经典工作，其中包括深度卷积神经网络在情感识别中的应用研究。Lee 等人（2017）提出的虚拟老年人伴侣系统即是一个典型案例，该系统利用深度学习技术对语音情感进行分类，实现了对老年人情感状态的智能识别与响应。此外，该数据集还激发了其他研究者对情感语音合成、情感对话系统等方向的探索，推动了情感计算领域的技术进步。

数据集最近研究