renumics/emodb-enriched
收藏Hugging Face2023-09-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/renumics/emodb-enriched
下载链接
链接失效反馈官方服务:
资源简介:
---
size_categories:
- n<1K
dataset_info:
features:
- name: age
dtype: float32
- name: gender
dtype:
class_label:
names:
'0': female
'1': male
- name: emotion
dtype:
class_label:
names:
'0': anger
'1': boredom
'2': disgust
'3': fear
'4': happiness
'5': neutral
'6': sadness
- name: audio
dtype: audio
- name: m1_gender_prediction
dtype:
class_label:
names:
'0': female
'1': male
- name: m2_gender_prediction
dtype:
class_label:
names:
'0': female
'1': male
- name: m1_embedding
sequence: float32
length: 1028
- name: m2_embedding
sequence: float32
length: 1028
- name: emotion_embedding
sequence: float32
length: 1024
- name: m1_correct
dtype:
class_label:
names:
'0': wrong
'1': correct
- name: m2_correct
dtype:
class_label:
names:
'0': wrong
'1': correct
splits:
- name: train
num_bytes: 54231717.0
num_examples: 535
download_size: 56965550
dataset_size: 54231717.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for Dataset Name
## Dataset Description
About Dataset
Emo-DB Database
The EMODB database is the freely available German emotional database. The database is created by the Institute of Communication Science, Technical University, Berlin, Germany. Ten professional speakers (five males and five females) participated in data recording. The database contains a total of 535 utterances. The EMODB database comprises of seven emotions: 1) anger; 2) boredom; 3) anxiety; 4) happiness; 5) sadness; 6) disgust; and 7) neutral. The data was recorded at a 48-kHz sampling rate and then down-sampled to 16-kHz.
Additional Information
Original URL: https://www.tu.berlin/en/kw/research/projects/emotional-speech
Every utterance is named according to the same scheme:
Positions 1-2: number of speaker
Positions 3-5: code for text
Position 6: emotion (sorry, letter stands for german emotion word)
Position 7: if there are more than two versions these are numbered a, b, c ....
Example: 03a01Fa.wav is the audio file from Speaker 03 speaking text a01 with the emotion "Freude" (Happiness).
Information about the speakers
03 - male, 31 years old
08 - female, 34 years
09 - female, 21 years
10 - male, 32 years
11 - male, 26 years
12 - male, 30 years
13 - female, 32 years
14 - female, 35 years
15 - male, 25 years
16 - female, 31 years
size_categories:
- 样本量小于1000(n<1K)
dataset_info:
features:
- name: age
dtype: 32位浮点型(float32)
- name: gender
dtype:
类别标签(class_label):
名称:
'0': 女性(female)
'1': 男性(male)
- name: emotion
dtype:
类别标签(class_label):
名称:
'0': 愤怒(anger)
'1': 无聊(boredom)
'2': 厌恶(disgust)
'3': 恐惧(fear)
'4': 快乐(happiness)
'5': 中性(neutral)
'6': 悲伤(sadness)
- name: audio
dtype: 音频(audio)
- name: m1_gender_prediction
dtype:
类别标签(class_label):
名称:
'0': 女性(female)
'1': 男性(male)
- name: m2_gender_prediction
dtype:
类别标签(class_label):
名称:
'0': 女性(female)
'1': 男性(male)
- name: m1_embedding
序列(sequence): 32位浮点型(float32)
长度: 1028
- name: m2_embedding
序列(sequence): 32位浮点型(float32)
长度: 1028
- name: emotion_embedding
序列(sequence): 32位浮点型(float32)
长度: 1024
- name: m1_correct
dtype:
类别标签(class_label):
名称:
'0': 错误(wrong)
'1': 正确(correct)
- name: m2_correct
dtype:
类别标签(class_label):
名称:
'0': 错误(wrong)
'1': 正确(correct)
splits:
- name: 训练集(train)
字节数: 54231717.0
样本量: 535
下载大小: 56965550
数据集总大小: 54231717.0
configs:
- 配置名称(config_name): 默认(default)
数据文件:
- split: 训练集(train)
路径: data/train-*
# 数据集卡片(Dataset Card):数据集名称
## 数据集描述
### 关于本数据集
Emo-DB 数据库(EMODB Database)
EMODB 是可免费获取的德语情感语音数据库,由德国柏林工业大学通信科学研究所创建。共有10名专业配音者(5名男性、5名女性)参与数据录制,总计包含535条语音片段。该数据库涵盖7类情感:1)愤怒;2)无聊;3)焦虑;4)快乐;5)悲伤;6)厌恶;7)中性。数据录制时采用48kHz采样率,后下采样至16kHz。
#### 附加信息
原始链接:https://www.tu.berlin/en/kw/research/projects/emotional-speech
每条语音文件均遵循统一命名规则:
第1-2位:发音者编号
第3-5位:文本编码
第6位:情感标签(注:此处字母对应德语情感词汇)
第7位:若存在多个版本,则以a、b、c……编号区分
示例:03a01Fa.wav 为编号03的发音者以情感“Freude”(即快乐(Happiness))朗读文本a01的音频文件。
#### 发音者信息
03 - 男性,31岁
08 - 女性,34岁
09 - 女性,21岁
10 - 男性,32岁
11 - 男性,26岁
12 - 男性,30岁
13 - 女性,32岁
14 - 女性,35岁
15 - 男性,25岁
16 - 女性,31岁
提供机构:
renumics
原始信息汇总
数据集卡片
数据集描述
数据集概述
- 名称: Emo-DB 数据库
- 来源: 柏林工业大学通信科学研究所
- 参与者: 10 名专业演讲者(5 男 5 女)
- 总录音数量: 535 条
- 情感类别: 愤怒、无聊、焦虑、快乐、悲伤、厌恶、中性
- 采样率: 原始 48 kHz,后降采样至 16 kHz
数据集结构
- 特征:
age: 年龄,数据类型为float32gender: 性别,数据类型为class_label,标签为female和maleemotion: 情感,数据类型为class_label,标签包括anger,boredom,disgust,fear,happiness,neutral,sadnessaudio: 音频数据,数据类型为audiom1_gender_prediction: 模型1性别预测,数据类型为class_label,标签为female和malem2_gender_prediction: 模型2性别预测,数据类型为class_label,标签为female和malem1_embedding: 模型1嵌入向量,数据类型为float32,长度为 1028m2_embedding: 模型2嵌入向量,数据类型为float32,长度为 1028emotion_embedding: 情感嵌入向量,数据类型为float32,长度为 1024m1_correct: 模型1预测正确性,数据类型为class_label,标签为wrong和correctm2_correct: 模型2预测正确性,数据类型为class_label,标签为wrong和correct
数据集划分
- 训练集:
- 名称: train
- 字节数: 54231717.0
- 样本数: 535
数据集大小
- 下载大小: 56965550
- 数据集大小: 54231717.0
配置
- 默认配置:
- 名称: default
- 数据文件:
- 划分: train
- 路径: data/train-*
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是基于EMODB德语情感语音数据库的增强版本,包含535条音频记录,涵盖7种情感类别和多种特征(如年龄、性别预测结果、嵌入向量等)。数据集由10位专业演讲者录制,适用于情感分析和语音处理研究。
以上内容由遇见数据集搜集并总结生成



