renumics/emodb-enriched

Name: renumics/emodb-enriched
Creator: renumics
Published: 2023-09-23 08:54:14
License: 暂无描述

Hugging Face2023-09-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/renumics/emodb-enriched

下载链接

链接失效反馈

官方服务：

资源简介：

--- size_categories: - n<1K dataset_info: features: - name: age dtype: float32 - name: gender dtype: class_label: names: '0': female '1': male - name: emotion dtype: class_label: names: '0': anger '1': boredom '2': disgust '3': fear '4': happiness '5': neutral '6': sadness - name: audio dtype: audio - name: m1_gender_prediction dtype: class_label: names: '0': female '1': male - name: m2_gender_prediction dtype: class_label: names: '0': female '1': male - name: m1_embedding sequence: float32 length: 1028 - name: m2_embedding sequence: float32 length: 1028 - name: emotion_embedding sequence: float32 length: 1024 - name: m1_correct dtype: class_label: names: '0': wrong '1': correct - name: m2_correct dtype: class_label: names: '0': wrong '1': correct splits: - name: train num_bytes: 54231717.0 num_examples: 535 download_size: 56965550 dataset_size: 54231717.0 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for Dataset Name ## Dataset Description About Dataset Emo-DB Database The EMODB database is the freely available German emotional database. The database is created by the Institute of Communication Science, Technical University, Berlin, Germany. Ten professional speakers (five males and five females) participated in data recording. The database contains a total of 535 utterances. The EMODB database comprises of seven emotions: 1) anger; 2) boredom; 3) anxiety; 4) happiness; 5) sadness; 6) disgust; and 7) neutral. The data was recorded at a 48-kHz sampling rate and then down-sampled to 16-kHz. Additional Information Original URL: https://www.tu.berlin/en/kw/research/projects/emotional-speech Every utterance is named according to the same scheme: Positions 1-2: number of speaker Positions 3-5: code for text Position 6: emotion (sorry, letter stands for german emotion word) Position 7: if there are more than two versions these are numbered a, b, c .... Example: 03a01Fa.wav is the audio file from Speaker 03 speaking text a01 with the emotion "Freude" (Happiness). Information about the speakers 03 - male, 31 years old 08 - female, 34 years 09 - female, 21 years 10 - male, 32 years 11 - male, 26 years 12 - male, 30 years 13 - female, 32 years 14 - female, 35 years 15 - male, 25 years 16 - female, 31 years

size_categories: - 样本量小于1000（n<1K） dataset_info: features: - name: age dtype: 32位浮点型（float32） - name: gender dtype: 类别标签（class_label）: 名称: '0': 女性（female） '1': 男性（male） - name: emotion dtype: 类别标签（class_label）: 名称: '0': 愤怒（anger） '1': 无聊（boredom） '2': 厌恶（disgust） '3': 恐惧（fear） '4': 快乐（happiness） '5': 中性（neutral） '6': 悲伤（sadness） - name: audio dtype: 音频（audio） - name: m1_gender_prediction dtype: 类别标签（class_label）: 名称: '0': 女性（female） '1': 男性（male） - name: m2_gender_prediction dtype: 类别标签（class_label）: 名称: '0': 女性（female） '1': 男性（male） - name: m1_embedding 序列（sequence）: 32位浮点型（float32）长度: 1028 - name: m2_embedding 序列（sequence）: 32位浮点型（float32）长度: 1028 - name: emotion_embedding 序列（sequence）: 32位浮点型（float32）长度: 1024 - name: m1_correct dtype: 类别标签（class_label）: 名称: '0': 错误（wrong） '1': 正确（correct） - name: m2_correct dtype: 类别标签（class_label）: 名称: '0': 错误（wrong） '1': 正确（correct） splits: - name: 训练集（train）字节数: 54231717.0 样本量: 535 下载大小: 56965550 数据集总大小: 54231717.0 configs: - 配置名称（config_name）: 默认（default）数据文件: - split: 训练集（train）路径: data/train-* # 数据集卡片（Dataset Card）：数据集名称 ## 数据集描述 ### 关于本数据集 Emo-DB 数据库（EMODB Database） EMODB 是可免费获取的德语情感语音数据库，由德国柏林工业大学通信科学研究所创建。共有10名专业配音者（5名男性、5名女性）参与数据录制，总计包含535条语音片段。该数据库涵盖7类情感：1）愤怒；2）无聊；3）焦虑；4）快乐；5）悲伤；6）厌恶；7）中性。数据录制时采用48kHz采样率，后下采样至16kHz。 #### 附加信息原始链接：https://www.tu.berlin/en/kw/research/projects/emotional-speech 每条语音文件均遵循统一命名规则：第1-2位：发音者编号第3-5位：文本编码第6位：情感标签（注：此处字母对应德语情感词汇）第7位：若存在多个版本，则以a、b、c……编号区分示例：03a01Fa.wav 为编号03的发音者以情感“Freude”（即快乐（Happiness））朗读文本a01的音频文件。 #### 发音者信息 03 - 男性，31岁 08 - 女性，34岁 09 - 女性，21岁 10 - 男性，32岁 11 - 男性，26岁 12 - 男性，30岁 13 - 女性，32岁 14 - 女性，35岁 15 - 男性，25岁 16 - 女性，31岁

提供机构：

renumics

原始信息汇总

数据集卡片

数据集描述

数据集概述

名称: Emo-DB 数据库
来源: 柏林工业大学通信科学研究所
参与者: 10 名专业演讲者（5 男 5 女）
总录音数量: 535 条
情感类别: 愤怒、无聊、焦虑、快乐、悲伤、厌恶、中性
采样率: 原始 48 kHz，后降采样至 16 kHz

数据集结构

特征:
- age: 年龄，数据类型为 float32
- gender: 性别，数据类型为 class_label，标签为 female 和 male
- emotion: 情感，数据类型为 class_label，标签包括 anger, boredom, disgust, fear, happiness, neutral, sadness
- audio: 音频数据，数据类型为 audio
- m1_gender_prediction: 模型1性别预测，数据类型为 class_label，标签为 female 和 male
- m2_gender_prediction: 模型2性别预测，数据类型为 class_label，标签为 female 和 male
- m1_embedding: 模型1嵌入向量，数据类型为 float32，长度为 1028
- m2_embedding: 模型2嵌入向量，数据类型为 float32，长度为 1028
- emotion_embedding: 情感嵌入向量，数据类型为 float32，长度为 1024
- m1_correct: 模型1预测正确性，数据类型为 class_label，标签为 wrong 和 correct
- m2_correct: 模型2预测正确性，数据类型为 class_label，标签为 wrong 和 correct