Chinese Speech Emotion Datasets
收藏github2024-04-15 更新2024-05-31 收录
下载链接:
https://github.com/artmusic0/Chinese-Speech-Emotion-Datasets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含传统中文(台湾)的语音数据及其转换的频谱图。数据由一些研究生朋友收集,部分来自YouTube视频剪辑,并分为三个类别:正面、自然和负面。
This dataset comprises speech data in Traditional Chinese (Taiwan) along with their corresponding spectrograms. The data was collected by a group of graduate student friends, partially sourced from YouTube video clips, and categorized into three classes: positive, neutral, and negative.
创建时间:
2017-08-10
原始信息汇总
中文语音情感数据集概述
数据集描述
本数据集包含传统中文(台湾)的语音数据及其转换的频谱图。数据由一些研究生朋友收集,部分来自YouTube视频剪辑,并分为三个类别。
数据集详情
类别分布
| 类别 | 正面 | 中性 | 负面 |
|---|---|---|---|
| 总数 | 218 | 214 | 220 |
| 训练集 | 200 | 200 | 200 |
| 测试集 | 18 | 14 | 20 |
测试数据是从所有总数数据中随机选取的。
搜集汇总
数据集介绍

构建方式
该数据集的构建基于传统中文(台湾)语音数据,涵盖了从实际录音和YouTube视频中剪辑的语音片段。这些数据被转换为频谱图,并被分类为三种情感类别:积极、自然和消极。训练集和测试集的划分遵循均衡分布,确保每类情感在训练和测试数据中均有合理的比例。测试数据是从总数中随机抽取的,以确保数据的随机性和代表性。
特点
该数据集的主要特点在于其情感分类的多样性和数据的均衡分布。每种情感类别均包含约200条训练数据和少量测试数据,确保了模型训练和评估的可靠性。此外,数据集中的语音数据被转换为频谱图,这为基于图像的深度学习模型提供了便利,尤其是在处理语音情感识别任务时。
使用方法
使用该数据集时,用户可以将其用于训练和评估语音情感识别模型。数据集提供了训练集和测试集的划分,用户可以直接加载这些数据进行模型训练和验证。建议在使用时引用相关文献,以确保学术诚信和数据来源的透明性。该数据集适用于基于深度学习的语音情感分析研究,尤其是那些依赖于频谱图特征的模型。
背景与挑战
背景概述
Chinese Speech Emotion Datasets是由一群研究生朋友收集并整理的语音情感数据集,主要包含来自台湾地区的传统中文语音数据,并转换为频谱图形式。该数据集分为三类情感:积极、自然和消极,每类情感包含218、214和220条语音数据。数据集的构建旨在支持情感识别领域的研究,特别是基于深度学习的语音情感分析。该数据集的创建时间可追溯至2017年,主要研究人员包括李明哲、叶圣成、邱圣宇和张家玮,他们的研究成果发表于MMSys'17会议,展示了基于深度卷积神经网络的虚拟老年人伴侣代理系统。该数据集对语音情感识别领域的研究具有重要影响,为相关算法提供了宝贵的实验数据。
当前挑战
Chinese Speech Emotion Datasets在构建过程中面临多项挑战。首先,语音数据的收集和分类需要精确的情感标注,确保数据的情感标签准确无误。其次,数据集的多样性也是一个挑战,如何从不同来源(如YouTube视频)获取多样化的语音样本,以确保模型能够泛化到各种语音情境。此外,数据集的平衡性也是一个关键问题,尽管数据集在各类情感上的分布相对均衡,但仍需进一步优化以减少类别不平衡带来的影响。最后,数据集的隐私和版权问题也需要谨慎处理,确保所有数据的合法性和合规性。
常用场景
经典使用场景
Chinese Speech Emotion Datasets 数据集在情感分析领域具有显著的应用价值。该数据集通过收集和分类来自台湾地区的语音数据,涵盖了正面、自然和负面三种情感类别,为研究者提供了一个标准化的情感语音数据库。其经典使用场景包括情感识别模型的训练与验证,尤其是在自然语言处理和语音识别技术中,该数据集为构建高精度的情感分类系统提供了坚实的基础。
衍生相关工作
基于 Chinese Speech Emotion Datasets 数据集,研究者们开展了多项经典工作,其中包括深度卷积神经网络在情感识别中的应用研究。Lee 等人(2017)提出的虚拟老年人伴侣系统即是一个典型案例,该系统利用深度学习技术对语音情感进行分类,实现了对老年人情感状态的智能识别与响应。此外,该数据集还激发了其他研究者对情感语音合成、情感对话系统等方向的探索,推动了情感计算领域的技术进步。
数据集最近研究
最新研究方向
在情感计算领域,中文语音情感数据集的研究正逐步深入,尤其是在情感分类和语音识别的交叉应用中展现出显著潜力。该数据集通过提供传统中文(台湾)语音数据及其对应的频谱图,为研究者们提供了丰富的实验素材。当前,前沿研究主要集中在利用深度学习技术,如卷积神经网络(CNN),对语音情感进行精准分类,这在虚拟老年人伴侣系统等应用中具有重要意义。此外,随着情感计算在人机交互、心理健康监测等领域的广泛应用,该数据集的开放使用为相关研究提供了坚实的基础,推动了情感计算技术的进一步发展。
以上内容由遇见数据集搜集并总结生成



