Chinese Speech Emotion Datasets
收藏github2024-04-15 更新2024-05-31 收录
下载链接:
https://github.com/AkishinoShiame/Chinese-Speech-Emotion-Datasets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含传统中文(台湾)的语音数据及其转换的频谱图。数据由一些研究生朋友收集,部分来自YouTube视频,并分为三个类别:积极、自然和消极。
This dataset comprises speech data in Traditional Chinese (Taiwan) along with their corresponding spectrograms. The data was collected by some graduate student friends, partially sourced from YouTube videos, and categorized into three classes: positive, neutral, and negative.
创建时间:
2017-08-10
原始信息汇总
Chinese Speech Emotion Datasets 概述
数据集描述
- 语言: 传统中文(台湾)
- 数据类型: 语音数据及转换后的频谱图
- 数据来源: 由研究生朋友收集,部分来自YouTube视频剪辑
- 分类: 分为三个类别
数据集详情
分类统计
| 类别 | 积极 | 中性 | 消极 |
|---|---|---|---|
| 总数 | 218 | 214 | 220 |
| 训练集 | 200 | 200 | 200 |
| 测试集 | 18 | 14 | 20 |
测试数据
- 测试数据是从总数中随机选取的。
搜集汇总
数据集介绍

构建方式
该数据集的构建方式主要通过收集传统中文(台湾)的语音数据,并将其转换为频谱图。数据来源包括毕业生的语音样本以及从YouTube视频中剪辑的部分内容。这些数据被分类为三类情感:正面、自然和负面。训练集和测试集的划分基于随机抽样,确保了数据分布的均衡性。
特点
此数据集的显著特点在于其情感分类的多样性和数据来源的广泛性。数据集包含了218条正面情感、214条自然情感和220条负面情感的语音样本,且每类情感的训练集和测试集均经过精心划分,确保了数据集的实用性和可靠性。此外,数据集还提供了频谱图转换,便于进行更深入的语音情感分析。
使用方法
该数据集适用于语音情感识别的研究和应用,尤其适合用于训练和验证深度学习模型,如卷积神经网络。使用者可以通过加载语音数据及其对应的频谱图,进行情感分类模型的训练和测试。在使用过程中,建议引用Lee等人(2017)的研究成果,以确保学术诚信和数据来源的透明性。
背景与挑战
背景概述
Chinese Speech Emotion Datasets是由一群毕业生朋友收集并整理的语音情感数据集,主要包含来自台湾地区的传统中文语音数据,并转换为频谱图形式。该数据集分为三类情感:积极、自然和消极,每类包含约200条训练数据和少量测试数据。数据集的创建旨在支持情感识别研究,特别是在语音情感分析领域,为开发基于深度学习的虚拟老年人伴侣系统提供了基础数据。该数据集的引用文献包括Lee等人于2017年发表的关于深度卷积神经网络在虚拟老年人伴侣系统中的应用研究,展示了其在情感计算领域的潜在应用价值。
当前挑战
Chinese Speech Emotion Datasets在构建过程中面临多项挑战。首先,语音数据的收集和标注需要大量的人力和时间,尤其是情感分类的准确性依赖于专业的心理学和语音学知识。其次,数据集的规模相对较小,可能导致模型训练时的过拟合问题,限制了其在复杂场景中的泛化能力。此外,数据来源的多样性和质量控制也是一个挑战,特别是从YouTube等平台获取的数据可能包含噪音或不一致性,影响数据集的整体质量。这些挑战需要在未来的研究中进一步解决,以提升数据集的实用性和可靠性。
常用场景
经典使用场景
Chinese Speech Emotion Datasets 主要用于情感识别领域,特别是在语音情感分析中。该数据集包含了台湾普通话的语音数据及其转换后的频谱图,分为正面、自然和负面三类情感。研究者可以利用这些数据训练和验证情感识别模型,尤其是在深度学习框架下,如卷积神经网络(CNN),以提高情感分类的准确性和鲁棒性。
实际应用
在实际应用中,Chinese Speech Emotion Datasets 可用于开发智能语音助手、情感辅助治疗系统以及老年人陪伴机器人等。例如,在老年人陪伴机器人中,通过识别用户的情感状态,机器人可以提供更加个性化和情感化的互动,从而提高用户体验和生活质量。此外,该数据集还可用于情感分析的商业应用,如客户服务中的情感监控和反馈分析。
衍生相关工作
基于 Chinese Speech Emotion Datasets,许多研究工作得以展开,特别是在情感识别和语音处理领域。例如,Lee 等人(2017)在其研究中使用该数据集开发了一种基于深度卷积神经网络的虚拟老年人陪伴机器人,展示了数据集在实际应用中的潜力。此外,该数据集还激发了其他研究者探索不同情感识别模型和算法的性能,推动了情感计算和人工智能领域的技术进步。
以上内容由遇见数据集搜集并总结生成



