EM²LDL
收藏EM²LDL 数据集概述
数据集简介
EM²LDL 是一个新颖的多语言语音语料库,旨在通过标签分布学习推进混合情感识别。该语料库解决了现有语料库主要为单语言、单标签,从而限制语言多样性、无法建模混合情感且缺乏生态效度的问题。
核心内容
- 语言构成:包含英语、普通话和粤语的情感表达话语,捕捉了香港和澳门等多语言地区普遍存在的语码转换现象。
- 语料来源:整合了来自在线平台的自发情感表达。
- 标注体系:采用基于 Plutchik 情感轮的 32 个情感类别,每个话语均标注有细粒度的情感概率分布。标注基于 20 名标注者的评估。
- 标注统计:每个话语平均关联 9.25 个情感标签(标准差:1.65),最多 16 个,最少 4 个,反映了混合情感状态的复杂性。
数据规模
- 话语总数:3,998 个音频话语。
- 总时长:14,540.08 秒(约 4.04 小时)。
- 平均时长:每个话语平均 3.64 秒。
- 语码转换对:包含粤语-英语 (CE)、普通话-英语 (ME) 和普通话-粤语 (MC) 三种语码转换对。
实验基准
使用自监督学习模型进行的实验基线表明,在独立于说话者的基于性别、年龄和人格的评估中表现稳健,其中 HuBERT-large-EN 模型取得了最佳结果。
应用价值
该语料库通过融入语言多样性和生态效度,为探索多语言环境下的复杂情感动态提供了可能,为开发用于情感计算(包括心理健康监测和跨文化交流)的自适应、共情系统提供了一个多功能测试平台。
获取方式
用户需下载用户许可协议 (LA.pdf),填写完整后发送给 Dr. Xingfeng Li (xfli@cityu.edu.mo)。在签署的协议被接收并批准后,用户将收到下载数据库的说明。
引用
如需引用,请使用提供的引用信息:
@misc{li2025em2ldlmultilingualspeechcorpus, title={EM2LDL: A Multilingual Speech Corpus for Mixed Emotion Recognition through Label Distribution Learning}, author={Xingfeng Li and Xiaohan Shi and Junjie Li and Yongwei Li and Masashi Unoki and Tomoki Toda and Masato Akagi}, year={2025}, eprint={2511.20106}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2511.20106}, }




