TAESOO98/meld-tts-gender_speaker3
收藏Hugging Face2024-05-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/TAESOO98/meld-tts-gender_speaker3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个语音相关的特征,如文本、说话者ID、性别、音高均值、音高标准差、信噪比、C50、语速、音素、音高、噪声、混响和语音单调性等。数据集分为训练集、验证集和测试集,分别包含9985、1108和2608个样本。数据集的下载大小为1296568字节,总大小为3227820字节。
该数据集包含多个语音相关的特征,如文本、说话者ID、性别、音高均值、音高标准差、信噪比、C50、语速、音素、音高、噪声、混响和语音单调性等。数据集分为训练集、验证集和测试集,分别包含9985、1108和2608个样本。数据集的下载大小为1296568字节,总大小为3227820字节。
提供机构:
TAESOO98
原始信息汇总
数据集概述
数据集特征
- text:文本,数据类型为字符串。
- speaker_id:说话者ID,数据类型为整数。
- gender:性别,数据类型为字符串。
- utterance_pitch_mean:语音平均音高,数据类型为浮点数。
- utterance_pitch_std:语音音高标准差,数据类型为浮点数。
- snr:信噪比,数据类型为浮点数。
- c50:C50指标,数据类型为浮点数。
- speaking_rate:说话速率,数据类型为字符串。
- phonemes:音素,数据类型为字符串。
- pitch:音高,数据类型为字符串。
- noise:噪音,数据类型为字符串。
- reverberation:混响,数据类型为字符串。
- speech_monotony:语音单调性,数据类型为字符串。
数据集分割
- 训练集:包含9985个样本,占用2346100字节。
- 验证集:包含1108个样本,占用260318字节。
- 测试集:包含2608个样本,占用621402字节。
数据集大小
- 下载大小:1296568字节。
- 数据集总大小:3227820字节。
配置文件
- 默认配置:包含训练、验证和测试集的路径配置。
- 训练集路径:
data/train-* - 验证集路径:
data/valid-* - 测试集路径:
data/test-*
- 训练集路径:



