CAiRE/YueMotion
收藏Hugging Face2023-06-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CAiRE/YueMotion
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-sa-4.0
language:
- yue
tags:
- speech
- speech-emotion-recognition
pretty_name: YueMotion
size_categories:
- 1K<n<10K
---
# YueMotion
A Cantonese speech emotion recognition by adult (7 females + 4 males) and elderly (5 females + 2 males) speakers with 5 emotion labels: anger (1), happy (2), sad (3), neutral (4), fear (5), disgust (6).
In total, YueMotion consists of 1080 utterances, i.e., 420 utterances for elderly and 660 for adults.
## Dataset Details
For the details (e.g., the statistics of `train`, `valid`, and `test` data), please refer to our paper on [arXiv](https://arxiv.org/abs/2306.14517).
## Citation
Our paper will be published at INTERSPEECH 2023. In the meantime, you can find our paper on [arXiv](https://arxiv.org/abs/2306.14517).
If you find our work useful, please consider citing our paper as follows:
```
@misc{cahyawijaya2023crosslingual,
title={Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition},
author={Samuel Cahyawijaya and Holy Lovenia and Willy Chung and Rita Frieske and Zihan Liu and Pascale Fung},
year={2023},
eprint={2306.14517},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
```
许可证:知识共享署名-相同方式共享4.0(CC-BY-SA-4.0)协议
语言:粤语(yue)
标签:语音、语音情感识别(speech-emotion-recognition)
数据集展示名称:YueMotion
样本量范围:1000 < n < 10000
# YueMotion
本数据集为粤语语音情感识别数据集,采集自成年说话者(7名女性、4名男性)与老年说话者(5名女性、2名男性),共涵盖6种情感标签:愤怒(1)、高兴(2)、悲伤(3)、中性(4)、恐惧(5)、厌恶(6)。YueMotion总计包含1080条语音片段,其中老年组420条,成年组660条。
## 数据集详情
有关训练集(train)、验证集(valid)与测试集(test)的详细统计信息,请参阅我们发表于arXiv的论文:https://arxiv.org/abs/2306.14517。
## 引用说明
我们的论文将被INTERSPEECH 2023收录,在此之前您可通过arXiv获取论文全文:https://arxiv.org/abs/2306.14517。若您认为本工作对您的研究有所帮助,请按照以下格式引用我们的论文:
@misc{cahyawijaya2023crosslingual,
title={Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition},
author={Samuel Cahyawijaya and Holy Lovenia and Willy Chung and Rita Frieske and Zihan Liu and Pascale Fung},
year={2023},
eprint={2306.14517},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
提供机构:
CAiRE
原始信息汇总
YueMotion 数据集概述
基本信息
- 许可证: cc-by-sa-4.0
- 语言: 粤语 (Yue)
- 标签:
- 语音
- 语音情感识别
- 数据集名称: YueMotion
- 大小: 1K<n<10K 条记录
数据集内容
- 参与者: 成人(7 名女性 + 4 名男性)和老年人(5 名女性 + 2 名男性)
- 情感标签: 愤怒 (1), 快乐 (2), 悲伤 (3), 中性 (4), 恐惧 (5), 厌恶 (6)
- 总记录数: 1080 条语音记录
- 老年人: 420 条
- 成人: 660 条
数据集详情
- 数据划分: 训练集、验证集和测试集的具体统计信息,请参阅相关论文。
引用信息
-
论文标题: Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition
-
作者: Samuel Cahyawijaya, Holy Lovenia, Willy Chung, Rita Frieske, Zihan Liu, Pascale Fung
-
发表年份: 2023
-
arXiv 预印本: 2306.14517
-
引用格式:
@misc{cahyawijaya2023crosslingual, title={Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition}, author={Samuel Cahyawijaya and Holy Lovenia and Willy Chung and Rita Frieske and Zihan Liu and Pascale Fung}, year={2023}, eprint={2306.14517}, archivePrefix={arXiv}, primaryClass={cs.CL} }
搜集汇总
数据集介绍

构建方式
CAiRE/YueMotion数据集的构建,是通过收集7位女性与4位男性成年发音者以及5位女性与2位男性老年发音者的语音样本,进而对这些语音样本进行情感标注,涵盖愤怒、快乐、悲伤、中性、恐惧与厌恶等五个情感标签。该数据集总计包含1080条发音,其中420条来自老年发音者,660条来自成年发音者,构建了一个适用于粤语情感识别研究的数据资源。
特点
YueMotion数据集的特点在于其专注于粤语语音的情感识别,并特别关注老年人群体的语音数据。数据集包含不同年龄层和性别的发音者,使得该数据集在情感识别研究中具有广泛的应用价值。此外,其标注的五类情感标签为研究提供了明确且可操作的分类依据,有助于促进跨年龄组的情感识别算法开发与评估。
使用方法
使用YueMotion数据集,研究者可以参照其官方论文中提供的统计数据,按照训练集、验证集和测试集的划分进行情感识别模型的训练与测试。数据集遵循cc-by-sa-4.0协议,用户在遵守相关许可规定的前提下,可以通过其提供的arXiv论文链接获取详细使用说明,并在研究成果中引用相关论文以表明数据来源。
背景与挑战
背景概述
YueMotion数据集是在2023年由Samuel Cahyawijaya等研究人员创建的,专注于粤语语音情感识别领域。该数据集的构建旨在解决老年人与成年人间语音情感识别的跨年龄组别问题,并包含了7位女性和4位男性的成年讲话者,以及5位女性和2位男性的老年讲话者的1080段语音。数据集标注了五种情感标签:愤怒、快乐、悲伤、中性以及恐惧和厌恶。YueMotion的创建填补了粤语语音情感识别领域的空白,对跨年龄组的语音识别研究和应用具有重要的影响力。
当前挑战
YueMotion数据集面临的挑战主要在于粤语这一低资源语言的语音情感识别,尤其是在老年人群中的识别准确性。构建过程中,研究人员克服了跨年龄组的语音特征差异、情感表达的复杂性和粤语语音识别资源匮乏等挑战。此外,数据集的规模限制也带来了在模型泛化能力和情感标签分布均衡性方面的挑战。
常用场景
经典使用场景
在粤语语音情感识别领域,YueMotion数据集提供了宝贵的资源,其经典使用场景主要在于训练深度学习模型,以识别出粤语说话者的情感状态。通过该数据集,研究者可以构建模型,对愤怒、快乐、悲伤、中性、恐惧和厌恶这六种情感类别进行准确分类。
衍生相关工作
基于YueMotion数据集的研究成果,已经衍生出一系列相关工作,如跨语言和跨年龄组的语音情感识别模型自适应研究,这些研究进一步拓展了语音情感识别技术的应用范围,并促进了相关领域的知识创新。
数据集最近研究
最新研究方向
在粤语语音情感识别领域,CAiRE/YueMotion数据集的构建标志着对老年人群体的关注日益增加。该数据集集合了成人与老年人的语音样本,并标注有六种情感状态,为研究提供了珍贵的资源。近期研究聚焦于跨语言跨年龄组的适配问题,旨在提升对低资源老年人群的语音情感识别准确率,这对于辅助老年心理健康评估、智能交互系统的人性化设计等领域具有深远影响。
以上内容由遇见数据集搜集并总结生成



