Emo-Emilia
收藏Hugging Face2025-02-26 更新2025-02-27 收录
下载链接:
https://huggingface.co/datasets/ASLP-lab/Emo-Emilia
下载链接
链接失效反馈官方服务:
资源简介:
Emo-Emilia数据集是一个新的情感识别测试集,旨在更好地模拟现实世界语境。该数据集通过自动化标注方法对大规模的多语种、多样化语音生成资源Emilia进行标注,其中包含超过10万小时的语音数据,涵盖广泛的情绪语境。经过至少两名专家的人工审核,确保了情绪标签的准确性和可靠性。最终提出的测试集Emo-Emilia包含1400个测试样本,涵盖七种情绪类别(愤怒、快乐、恐惧、惊讶、中性、悲伤和厌恶),每种情绪类别有100个样本,同时支持中文和英文,每种语言700个样本。
创建时间:
2025-02-25
搜集汇总
数据集介绍

构建方式
Emo-Emilia数据集的构建,旨在通过模拟现实世界的语境,提升情感识别的准确性。该数据集的构建采用自动化标注方法,对Emilia这一包含超过10万小时语音数据的大型多语种、多样化语音生成资源进行标注,以涵盖丰富的情感语境。标注完成后,通过至少两位专家的人工复核,确保情感标签的准确性与可靠性。
特点
Emo-Emilia数据集作为Emilia数据集的一个子集,具备多种显著特点。它不仅包含中文与英文两种语言的数据,还涵盖了愤怒、快乐、恐惧、惊讶、中性、悲伤和厌恶七种情感类别,每种情感类别下均有100个样本。此数据集的多样性及均衡性使其成为情感识别研究领域中极具价值的资源。
使用方法
用户可通过HuggingFace平台获取Emo-Emilia数据集。使用时,用户可以下载包含所有音频信息的`Emo-Emilia-ALL.jsonl`文件,以便进行更深入的音频分析与情感识别研究。此外,详细的数据集使用方法和相关技术细节可以在我们的论文《Steering Language Model to Stable Speech Emotion Recognition via Contextual Perception and Chain of Thought》以及C2SER的GitHub页面中找到。
背景与挑战
背景概述
在语音情感识别领域,模拟真实世界语境的需求催生了Emo-Emilia数据集的创建。该数据集由ASLP-lab团队于近年来推出,旨在利用Emilia这一大规模多语种、多样化的语音生成资源,通过自动化标注方法,捕捉广泛情感语境。Emilia语音资源超过10万小时,其情感标签经过至少两位专家的手动审核,确保了Emo-Emilia数据集的准确性与可靠性。该数据集包含1400个测试样本,涵盖七种情感类别,并提供中英两种语言版本,对语音情感识别研究具有重要的参考价值。
当前挑战
Emo-Emilia数据集在构建过程中面临了诸多挑战。首先,自动化标注方法的准确性和可靠性验证是一项关键任务,需要通过专家审核来确保标签质量。其次,数据集中涉及的多语种和多样化情感语境,要求研究者在模型设计时充分考虑跨语言和跨文化的差异。此外,如何有效利用大规模语音数据,同时保证数据集的多样性与代表性,也是构建此类数据集的一大挑战。
常用场景
经典使用场景
在情感计算领域,Emo-Emilia数据集作为模拟真实世界语境的测试集,其经典的使用场景在于评估和训练语音情感识别模型。该数据集利用情感标签,覆盖了100个样本的七种情感类别,为研究者在开发和优化算法提供了丰富的、经过专家审核的情感语音样本。
衍生相关工作
基于Emo-Emilia数据集,研究者衍生出了一系列相关工作,如'C2SER'项目,探索了通过上下文感知和思维链引导语言模型进行稳定的语音情感识别。这些研究不仅拓展了数据集的应用范围,也促进了语音情感识别技术的进步。
数据集最近研究
最新研究方向
在语音情感识别领域,近期研究集中于开发能够捕捉广泛情感语境的高质量数据集。Emo-Emilia数据集的构建,通过自动化标注与专家审核相结合的方式,为研究提供了1400个经过精确标注的语音样本,覆盖七种情感类型,并包含中英两种语言。该数据集的推出,旨在通过模拟真实世界语境,推进语音模型在情感识别方面的稳定性和准确性。相关研究以论文形式发表,探讨了如何通过上下文感知与思维链引导语言模型进行稳定的情感识别,对情感计算领域具有重要意义。
以上内容由遇见数据集搜集并总结生成



