URDU-Dataset

github2024-03-27 更新2024-05-31 收录

下载链接：

https://github.com/siddiquelatif/URDU-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

URDU数据集包含从乌尔都语脱口秀中收集的情感语音。它包含四种基本情感（愤怒、快乐、中性、悲伤）的400条语音，由38位发言人（27位男性和11位女性）提供。数据来源于YouTube，仅供研究使用。文件命名规则详细，如SM1_F01_A12表示第1位男性发言人录制的第1个文件，属于愤怒情感的第12个文件。

The URDU dataset comprises emotional speech collected from Urdu talk shows. It includes 400 speech samples representing four basic emotions (anger, happiness, neutrality, sadness), contributed by 38 speakers (27 males and 11 females). The data is sourced from YouTube and is intended solely for research purposes. The file naming convention is detailed, for example, SM1_F01_A12 denotes the 12th file of anger emotion, recorded by the 1st male speaker as his 1st file.

创建时间：

2018-06-30

原始信息汇总

URDU-Dataset 概述

数据集内容

情感类别：包含四种基本情感：愤怒（Angry）、快乐（Happy）、中性（Neutral）和悲伤（Sad）。
语音数量：共有400条语音记录。
发言人信息：涉及38位发言人，其中男性27位，女性11位。

文件命名规则

命名格式：SGX_FXX_EYY
命名解析：
- SGX：S表示性别（M代表男性，F代表女性），G表示发言人ID。
- FXX：F表示文件，XX表示该发言人文件的编号。
- EYY：E表示情感类型（A代表愤怒，H代表快乐，N代表中性，S代表悲伤），YY表示该情感类型的文件编号。

数据来源

来源：数据收集自YouTube上的乌尔都语脱口秀节目。

使用目的

目的：仅供研究使用。

详细信息

详细论文：关于数据集的详细信息，请参阅论文《跨语言语音情感识别：乌尔都语与西方语言》，链接为：https://arxiv.org/pdf/1812.10411.pdf。

搜集汇总

数据集介绍

构建方式

URDU数据集构建于乌尔都语情感语音的收集，数据源自YouTube上的乌尔都语脱口秀节目。该数据集涵盖了400条语音样本，表达了四种基本情感：愤怒、快乐、中立和悲伤。数据采集过程中，随机选取了38位演讲者，其中包括27位男性和11位女性。文件命名遵循特定规则，以提供演讲者性别、编号及情感类型等详细信息。

使用方法

URDU数据集的使用方法相对简便，研究者可通过文件命名规则快速定位所需样本。数据集适用于情感语音识别、跨语言情感分析等领域的研究。使用该数据集时，需遵循仅用于研究目的的规定。为进一步了解数据集，建议参考相关论文《Cross Lingual Speech Emotion Recognition: Urdu vs. Western Languages》。

背景与挑战

背景概述

URDU数据集是一个专注于乌尔都语情感语音识别的数据集，创建于2018年，主要研究人员通过从乌尔都语脱口秀节目中收集情感语音数据，旨在推动跨语言情感语音识别的研究。该数据集包含400条语音样本，涵盖了四种基本情感：愤怒、快乐、中性和悲伤，涉及38位不同性别（27位男性和11位女性）的说话者。数据集的构建基于YouTube视频资源，采用随机选择说话者的方式，确保了数据的多样性和代表性。该数据集的研究成果发表在论文《Cross Lingual Speech Emotion Recognition: Urdu vs. Western Languages》中，为乌尔都语情感语音识别领域提供了重要的数据支持，并促进了跨语言情感识别技术的发展。

当前挑战

URDU数据集在解决乌尔都语情感语音识别问题时面临多重挑战。情感语音识别本身具有较高的复杂性，因为情感表达具有主观性和文化依赖性，乌尔都语作为一种资源较少的语言，缺乏足够的高质量标注数据。数据集的构建过程中，研究人员需要从YouTube视频中提取语音片段，并进行情感标注，这一过程耗时且容易受到背景噪音和语音质量的影响。此外，数据集的规模相对较小，可能限制了模型的泛化能力。跨语言情感识别的研究还面临语言间情感表达差异的挑战，如何将乌尔都语情感识别模型推广到其他语言仍需进一步探索。

常用场景

经典使用场景

URDU数据集在语音情感识别领域具有重要应用，特别是在跨语言情感分析研究中。该数据集包含了乌尔都语演讲中的情感表达，涵盖了愤怒、快乐、中性和悲伤四种基本情感。研究者通常利用该数据集来训练和测试情感识别模型，尤其是在处理非西方语言的情感表达时，URDU数据集提供了宝贵的资源。通过分析不同性别和情感状态下的语音特征，研究者能够深入探讨情感表达的跨文化差异。

解决学术问题

URDU数据集有效解决了跨语言情感识别中的关键问题，尤其是在乌尔都语等非西方语言的情感分析领域。传统的情感识别研究多集中于英语等主流语言，而URDU数据集的引入填补了这一空白，使得研究者能够探索不同语言背景下的情感表达模式。该数据集不仅为跨语言情感识别模型的开发提供了数据支持，还为理解情感表达的文化差异提供了实证依据，推动了语音情感识别领域的多元化发展。

实际应用

在实际应用中，URDU数据集为开发多语言情感识别系统提供了重要支持。例如，在智能客服系统中，情感识别技术可以帮助系统更好地理解用户的情绪状态，从而提供更加个性化的服务。此外，该数据集还可用于心理健康监测，通过分析语音中的情感特征，辅助诊断抑郁症等情感障碍。在教育领域，情感识别技术可以用于评估学生的学习状态，帮助教师更好地调整教学策略。

数据集最近研究