five

renumics/emodb-enriched

收藏
Hugging Face2023-09-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/renumics/emodb-enriched
下载链接
链接失效反馈
官方服务:
资源简介:
--- size_categories: - n<1K dataset_info: features: - name: age dtype: float32 - name: gender dtype: class_label: names: '0': female '1': male - name: emotion dtype: class_label: names: '0': anger '1': boredom '2': disgust '3': fear '4': happiness '5': neutral '6': sadness - name: audio dtype: audio - name: m1_gender_prediction dtype: class_label: names: '0': female '1': male - name: m2_gender_prediction dtype: class_label: names: '0': female '1': male - name: m1_embedding sequence: float32 length: 1028 - name: m2_embedding sequence: float32 length: 1028 - name: emotion_embedding sequence: float32 length: 1024 - name: m1_correct dtype: class_label: names: '0': wrong '1': correct - name: m2_correct dtype: class_label: names: '0': wrong '1': correct splits: - name: train num_bytes: 54231717.0 num_examples: 535 download_size: 56965550 dataset_size: 54231717.0 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for Dataset Name ## Dataset Description About Dataset Emo-DB Database The EMODB database is the freely available German emotional database. The database is created by the Institute of Communication Science, Technical University, Berlin, Germany. Ten professional speakers (five males and five females) participated in data recording. The database contains a total of 535 utterances. The EMODB database comprises of seven emotions: 1) anger; 2) boredom; 3) anxiety; 4) happiness; 5) sadness; 6) disgust; and 7) neutral. The data was recorded at a 48-kHz sampling rate and then down-sampled to 16-kHz. Additional Information Original URL: https://www.tu.berlin/en/kw/research/projects/emotional-speech Every utterance is named according to the same scheme: Positions 1-2: number of speaker Positions 3-5: code for text Position 6: emotion (sorry, letter stands for german emotion word) Position 7: if there are more than two versions these are numbered a, b, c .... Example: 03a01Fa.wav is the audio file from Speaker 03 speaking text a01 with the emotion "Freude" (Happiness). Information about the speakers 03 - male, 31 years old 08 - female, 34 years 09 - female, 21 years 10 - male, 32 years 11 - male, 26 years 12 - male, 30 years 13 - female, 32 years 14 - female, 35 years 15 - male, 25 years 16 - female, 31 years

size_categories: - 样本量小于1000(n<1K) dataset_info: features: - name: age dtype: 32位浮点型(float32) - name: gender dtype: 类别标签(class_label): 名称: '0': 女性(female) '1': 男性(male) - name: emotion dtype: 类别标签(class_label): 名称: '0': 愤怒(anger) '1': 无聊(boredom) '2': 厌恶(disgust) '3': 恐惧(fear) '4': 快乐(happiness) '5': 中性(neutral) '6': 悲伤(sadness) - name: audio dtype: 音频(audio) - name: m1_gender_prediction dtype: 类别标签(class_label): 名称: '0': 女性(female) '1': 男性(male) - name: m2_gender_prediction dtype: 类别标签(class_label): 名称: '0': 女性(female) '1': 男性(male) - name: m1_embedding 序列(sequence): 32位浮点型(float32) 长度: 1028 - name: m2_embedding 序列(sequence): 32位浮点型(float32) 长度: 1028 - name: emotion_embedding 序列(sequence): 32位浮点型(float32) 长度: 1024 - name: m1_correct dtype: 类别标签(class_label): 名称: '0': 错误(wrong) '1': 正确(correct) - name: m2_correct dtype: 类别标签(class_label): 名称: '0': 错误(wrong) '1': 正确(correct) splits: - name: 训练集(train) 字节数: 54231717.0 样本量: 535 下载大小: 56965550 数据集总大小: 54231717.0 configs: - 配置名称(config_name): 默认(default) 数据文件: - split: 训练集(train) 路径: data/train-* # 数据集卡片(Dataset Card):数据集名称 ## 数据集描述 ### 关于本数据集 Emo-DB 数据库(EMODB Database) EMODB 是可免费获取的德语情感语音数据库,由德国柏林工业大学通信科学研究所创建。共有10名专业配音者(5名男性、5名女性)参与数据录制,总计包含535条语音片段。该数据库涵盖7类情感:1)愤怒;2)无聊;3)焦虑;4)快乐;5)悲伤;6)厌恶;7)中性。数据录制时采用48kHz采样率,后下采样至16kHz。 #### 附加信息 原始链接:https://www.tu.berlin/en/kw/research/projects/emotional-speech 每条语音文件均遵循统一命名规则: 第1-2位:发音者编号 第3-5位:文本编码 第6位:情感标签(注:此处字母对应德语情感词汇) 第7位:若存在多个版本,则以a、b、c……编号区分 示例:03a01Fa.wav 为编号03的发音者以情感“Freude”(即快乐(Happiness))朗读文本a01的音频文件。 #### 发音者信息 03 - 男性,31岁 08 - 女性,34岁 09 - 女性,21岁 10 - 男性,32岁 11 - 男性,26岁 12 - 男性,30岁 13 - 女性,32岁 14 - 女性,35岁 15 - 男性,25岁 16 - 女性,31岁
提供机构:
renumics
原始信息汇总

数据集卡片

数据集描述

数据集概述

  • 名称: Emo-DB 数据库
  • 来源: 柏林工业大学通信科学研究所
  • 参与者: 10 名专业演讲者(5 男 5 女)
  • 总录音数量: 535 条
  • 情感类别: 愤怒、无聊、焦虑、快乐、悲伤、厌恶、中性
  • 采样率: 原始 48 kHz,后降采样至 16 kHz

数据集结构

  • 特征:
    • age: 年龄,数据类型为 float32
    • gender: 性别,数据类型为 class_label,标签为 femalemale
    • emotion: 情感,数据类型为 class_label,标签包括 anger, boredom, disgust, fear, happiness, neutral, sadness
    • audio: 音频数据,数据类型为 audio
    • m1_gender_prediction: 模型1性别预测,数据类型为 class_label,标签为 femalemale
    • m2_gender_prediction: 模型2性别预测,数据类型为 class_label,标签为 femalemale
    • m1_embedding: 模型1嵌入向量,数据类型为 float32,长度为 1028
    • m2_embedding: 模型2嵌入向量,数据类型为 float32,长度为 1028
    • emotion_embedding: 情感嵌入向量,数据类型为 float32,长度为 1024
    • m1_correct: 模型1预测正确性,数据类型为 class_label,标签为 wrongcorrect
    • m2_correct: 模型2预测正确性,数据类型为 class_label,标签为 wrongcorrect

数据集划分

  • 训练集:
    • 名称: train
    • 字节数: 54231717.0
    • 样本数: 535

数据集大小

  • 下载大小: 56965550
  • 数据集大小: 54231717.0

配置

  • 默认配置:
    • 名称: default
    • 数据文件:
      • 划分: train
      • 路径: data/train-*
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是基于EMODB德语情感语音数据库的增强版本,包含535条音频记录,涵盖7种情感类别和多种特征(如年龄、性别预测结果、嵌入向量等)。数据集由10位专业演讲者录制,适用于情感分析和语音处理研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作