JL-Corpus

github2023-02-10 更新2024-05-31 收录

下载链接：

https://github.com/tli725/JL-Corpus

下载链接

链接失效反馈

官方服务：

资源简介：

JL-Corpus是一个情感语音语料库，旨在深入理解人类语音中嵌入的广泛情感。该语料库通过在新西兰英语中保持4个长元音的均衡分布来构建，以促进与情感相关的共振峰和声门源特征比较研究。此外，语料库包含5种主要情感和5种次要情感，次要情感在人机交互（HRI）中非常重要，旨在模拟人类和机器人之间的自然对话。目前用于研究这些情感的语音资源非常有限，该工作增加了一个包含一些次要情感的语音语料库。

The JL-Corpus is an emotional speech corpus designed to delve into the broad spectrum of emotions embedded in human speech. This corpus is constructed by maintaining a balanced distribution of four long vowels in New Zealand English, facilitating comparative studies on formant and glottal source characteristics related to emotions. Additionally, the corpus encompasses five primary emotions and five secondary emotions, which are crucial in human-robot interaction (HRI), aiming to simulate natural dialogues between humans and robots. Currently, there is a scarcity of speech resources for studying these emotions, and this work contributes by adding a speech corpus that includes some secondary emotions.

创建时间：

2018-03-16

原始信息汇总

JL-Corpus 数据集概述

数据集目的

JL-Corpus 是一个情感语音语料库，旨在深入理解人类语音中嵌入的广泛情感。该语料库特别关注新西兰英语中的4个长元音的均衡分布，以支持情感相关的共振峰和声门源特征比较研究。

情感分类

主要情感：包含5种基本情感。
次要情感：包含5种次要情感，这些情感在人机交互（HRI）中尤为重要，旨在模拟自然的人机对话。

数据集内容

完整数据集：包括录音支持文件，可通过以下链接访问：JL-Corpus。
原始音频+txt文件：可通过以下链接获取：Raw JL corpus (unchecked and unannotated)。

数据集评估

该语料库已通过大规模的人类感知测试进行评估，共有120名参与者参与。

引用信息

使用该数据集时，请引用以下文献： Jesin James, Li Tian, Catherine Watson, "An Open Source Emotional Speech Corpus for Human Robot Interaction Applications", in Proc. Interspeech, 2018.

搜集汇总

数据集介绍

构建方式

JL-Corpus的构建旨在深入理解人类语音中蕴含的广泛情感。该语料库通过保持新西兰英语中四个长元音的均衡分布来构建，旨在促进与情感相关的共振峰和声门源特征的比较研究。此外，语料库不仅包含五种基本情感，还涵盖了五种次级情感，这些次级情感在人机交互（HRI）中尤为重要，旨在模拟人类与机器人之间的自然对话。

特点

JL-Corpus的显著特点在于其情感分类的全面性，不仅包含基本情感，还特别纳入了次级情感，这在现有的语音资源中较为罕见。语料库的构建还特别注重语音特征的平衡性，确保了长元音的均衡分布，为情感相关研究提供了更为精确的数据支持。此外，语料库经过大规模的人类感知测试，确保了数据的可靠性和有效性。

使用方法

JL-Corpus的使用方法相对简便，用户可通过Kaggle平台直接下载完整的语料库，包括录音支持文件。对于仅需原始音频和文本文件的用户，也可通过提供的链接获取。语料库的使用需遵循引用规范，确保在相关研究中正确引用原始文献。此外，语料库的感知验证和注释版本即将公开，用户可通过参与相关调查进一步了解语料库的录音类型和质量。

背景与挑战

背景概述

JL-Corpus是由Jesin James、Li Tian和Catherine Watson等研究人员于2018年发布的一个情感语音语料库，旨在深入理解人类语音中蕴含的广泛情感。该语料库特别关注新西兰英语中的四个长元音，并确保其在语料中的均衡分布，以便于情感相关的共振峰和声门源特征比较研究。此外，JL-Corpus不仅包含五种基本情感，还引入了五种次级情感，这些次级情感在人机交互（HRI）领域中尤为重要，旨在模拟人类与机器人之间的自然对话。该语料库的发布填补了现有语音资源在次级情感研究方面的空白，为人机交互和情感计算领域提供了重要的数据支持。

当前挑战

JL-Corpus的构建面临多重挑战。首先，情感语音数据的采集和标注需要高度的精确性和一致性，以确保数据的可靠性和有效性。其次，次级情感的定义和识别本身具有较高的复杂性，因为这些情感通常较为微妙且难以量化。此外，语料库的设计需要平衡不同元音的分布，以确保研究结果的普适性和可比性。在数据验证方面，尽管已通过大规模人类感知测试进行了评估，但情感的主观性仍可能导致标注结果的不一致性。最后，语料库的公开访问和持续更新也面临技术和管理上的挑战，需确保数据的长期可用性和可维护性。

常用场景

经典使用场景

JL-Corpus数据集在情感语音研究领域具有重要应用，尤其是在新西兰英语中的长元音情感表达分析中。该数据集通过平衡四种长元音的分布，为情感相关的共振峰和声门源特征比较研究提供了理想的基础。研究者可以利用该数据集深入探讨不同情感状态下的语音特征变化，特别是在人类与机器人交互（HRI）场景中，模拟自然对话的情感表达。

解决学术问题

JL-Corpus解决了情感语音研究中缺乏多样化情感数据的问题，尤其是次级情感的研究资源匮乏。该数据集不仅包含五种主要情感，还涵盖了五种次级情感，为情感语音的建模和分析提供了更全面的数据支持。通过大规模人类感知测试，数据集的可靠性和有效性得到了验证，为情感语音识别、情感计算等领域的研究提供了重要参考。

衍生相关工作

基于JL-Corpus，许多经典研究工作得以展开，例如情感语音特征提取、情感识别模型的训练与优化等。该数据集还被广泛应用于人类与机器人交互（HRI）领域的研究，推动了自然对话情感建模技术的发展。此外，相关研究还衍生出情感语音合成、情感计算等新兴研究方向，为智能语音技术的进步提供了重要支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集