five

Basic Arabic Vocal Emotions Dataset

收藏
github2024-04-26 更新2024-05-31 收录
下载链接:
https://github.com/Sho-Oter/Basic-Arabic-Vocal-Emotions-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Basic Arabic Vocal Emotions Dataset (BAVED) 是一个包含阿拉伯语单词在不同情感水平下录制的音频/wav格式数据集。该数据集包含7个阿拉伯语单词,每个单词在三种情感表达水平下录制:低情感(类似疲劳或情绪低落)、标准情感(日常中性表达)和高情感(积极或消极情绪,如快乐、悲伤、愤怒等)。数据集共有1935条记录,来自61位说话者,数据集大小为97.8 MB。

The Basic Arabic Vocal Emotions Dataset (BAVED) is a collection of audio recordings in WAV format, capturing Arabic words spoken at varying emotional intensities. This dataset includes seven Arabic words, each recorded under three distinct emotional levels: low emotion (resembling fatigue or low spirits), standard emotion (neutral, everyday expression), and high emotion (intense positive or negative emotions such as joy, sadness, or anger). Comprising a total of 1,935 recordings from 61 speakers, the dataset occupies 97.8 MB of storage.
创建时间:
2019-07-18
原始信息汇总

Basic Arabic Vocal Emotions Dataset (BAVED) 概述

数据集内容

  • 语言: 阿拉伯语
  • 单词数量: 7个
  • 单词列表: اعجبني, لم يعجبني, هذا, الفيلم, رائع, مقول, سيئ
  • 情感表达级别: 3级(低、中、高)

数据集规模

  • 记录总数: 1935
  • 发言人数量: 61
    • 男性发言人: 45
    • 女性发言人: 16
  • 数据集大小: 97.8 MB

文件元数据

  • 格式: audio/wav
  • 采样率: 16 kHz
  • 通道数: 1
  • 比特率: 256 kbit/s

文件命名规则

  • 命名格式: speaker_id - speaker_gender - speaker_age - spoken_word - spoken_emotion - record_id

使用建议

  • 主要用途: 阿拉伯语语音识别和情感检测
  • 注意事项: 由于数据集仅包含7个单词和3种情感级别,不建议用于商业用途。此外,由于性别和年龄分布不均,不建议基于此数据集构建性别或年龄相关的模型。
搜集汇总
数据集介绍
main_image_url
构建方式
Basic Arabic Vocal Emotions Dataset (BAVED) 的构建基于对阿拉伯语单词在不同情感表达水平下的音频记录。该数据集包含了七个阿拉伯语单词,每个单词在三种情感水平下被录制:低情感表达(类似疲惫或低落)、中性情感表达(日常说话方式)以及高情感表达(如快乐、悲伤、愤怒等强烈情感)。数据集中的音频文件经过标准化处理,采样率为16 kHz,单声道,比特率为256 kbit/s,以确保数据的一致性和可用性。
特点
BAVED 数据集的显著特点在于其专注于阿拉伯语语音情感的多样性表达。每个单词在三种情感水平下的录制,使得该数据集在情感识别和语音识别领域具有独特的应用价值。此外,数据集包含了61名说话者的录音,其中45名为男性,16名为女性,年龄主要集中在18至23岁之间,提供了性别和年龄的多样性。
使用方法
BAVED 数据集主要用于阿拉伯语语音识别和情感检测任务。用户可以通过训练模型来识别特定的阿拉伯语单词及其对应的情感水平。尽管数据集包含了说话者的性别和年龄信息,但由于性别和年龄分布的不均衡,不建议基于这些信息构建模型。此外,考虑到数据集的规模和单词数量有限,建议主要用于研究和实验目的,而非商业用途。
背景与挑战
背景概述
Basic Arabic Vocal Emotions Dataset (BAVED) 是由研究人员创建的一个专注于阿拉伯语语音情感表达的数据集。该数据集包含了七个阿拉伯语词汇,每个词汇在三种不同情感强度下被录制,分别为低情感、中性情感和高情感。BAVED 的创建旨在推动阿拉伯语语音识别和情感检测的研究,尤其是在情感计算和语音处理领域。数据集由61名不同性别的演讲者录制,总记录数为1935条,数据量为97.8 MB。BAVED 的发布为阿拉伯语情感分析提供了基础资源,填补了该领域数据集的空白,对相关研究具有重要意义。
当前挑战
BAVED 数据集在构建和应用过程中面临多项挑战。首先,情感强度的标注和录制需要高度的专业性和一致性,以确保数据的准确性和可靠性。其次,数据集中男性演讲者的数量远多于女性,且年龄范围较为集中,这可能导致性别和年龄偏差,限制了其在性别和年龄相关研究中的应用。此外,数据集仅包含七个词汇,且情感层次有限,这限制了其在复杂情感识别和多样化语音任务中的广泛应用。尽管如此,BAVED 仍为阿拉伯语情感检测提供了宝贵的初步资源,但其局限性需要在未来的研究中进一步克服。
常用场景
经典使用场景
Basic Arabic Vocal Emotions Dataset (BAVED) 主要用于阿拉伯语语音识别和情感检测。该数据集通过记录七个阿拉伯语单词在不同情感强度下的发音,为研究者提供了一个基础的情感语音数据库。经典的使用场景包括构建和训练用于阿拉伯语情感识别的模型,尤其是在低、中、高三种情感强度下的语音特征提取和分类任务中。
解决学术问题
BAVED 数据集解决了阿拉伯语情感语音识别中的关键问题,特别是在情感强度分类和语音特征分析方面。通过提供不同情感状态下的语音样本,该数据集有助于研究者开发更精确的情感识别算法,并为跨文化情感识别研究提供了宝贵的资源。其意义在于推动了阿拉伯语情感语音处理领域的发展,并为多语言情感识别技术的进步奠定了基础。
衍生相关工作
基于 BAVED 数据集,研究者们已经开展了一系列相关工作,包括情感语音识别模型的优化、跨文化情感识别的比较研究以及多语言情感数据库的构建。这些工作不仅推动了阿拉伯语情感语音处理技术的发展,还为全球范围内的情感识别研究提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作