TAESOO98/msc-tts-gender_speaker3

Name: TAESOO98/msc-tts-gender_speaker3
Creator: TAESOO98
Published: 2024-05-28 09:55:53
License: 暂无描述

Hugging Face2024-05-28 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/TAESOO98/msc-tts-gender_speaker3

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: text dtype: string - name: speaker_id dtype: int64 - name: gender dtype: string - name: utterance_pitch_mean dtype: float32 - name: utterance_pitch_std dtype: float32 - name: snr dtype: float64 - name: c50 dtype: float64 - name: speaking_rate dtype: string - name: phonemes dtype: string - name: pitch dtype: string - name: noise dtype: string - name: reverberation dtype: string - name: speech_monotony dtype: string splits: - name: train num_bytes: 5313435 num_examples: 25624 - name: valid num_bytes: 652832 num_examples: 3145 - name: test num_bytes: 547656 num_examples: 2640 download_size: 2258102 dataset_size: 6513923 configs: - config_name: default data_files: - split: train path: data/train-* - split: valid path: data/valid-* - split: test path: data/test-* ---

数据集信息：特征列表： - 名称：文本（text），数据类型：字符串（string） - 名称：说话人ID（speaker_id），数据类型：64位整型（int64） - 名称：性别（gender），数据类型：字符串（string） - 名称：语句基频均值（utterance_pitch_mean），数据类型：32位浮点型（float32） - 名称：语句基频标准差（utterance_pitch_std），数据类型：32位浮点型（float32） - 名称：信噪比（SNR），数据类型：64位浮点型（float64） - 名称：C50，数据类型：64位浮点型（float64） - 名称：说话速率（speaking_rate），数据类型：字符串（string） - 名称：音素（phonemes），数据类型：字符串（string） - 名称：基频（pitch），数据类型：字符串（string） - 名称：噪声（noise），数据类型：字符串（string） - 名称：混响（reverberation），数据类型：字符串（string） - 名称：言语单调度（speech_monotony），数据类型：字符串（string）数据集划分： - 划分名称：训练集（train），总字节数：5313435，样本数量：25624 - 划分名称：验证集（valid），总字节数：652832，样本数量：3145 - 划分名称：测试集（test），总字节数：547656，样本数量：2640 下载大小：2258102 数据集总大小：6513923 配置项： - 配置名称：默认（default）数据文件： - 训练集划分：路径为data/train-* - 验证集划分：路径为data/valid-* - 测试集划分：路径为data/test-*

提供机构：

TAESOO98

原始信息汇总

数据集概述

数据集特征

text：文本，数据类型为字符串。
speaker_id：说话者ID，数据类型为整数。
gender：性别，数据类型为字符串。
utterance_pitch_mean：语音平均音高，数据类型为浮点数。
utterance_pitch_std：语音音高标准差，数据类型为浮点数。
snr：信噪比，数据类型为浮点数。
c50：语音清晰度指标，数据类型为浮点数。
speaking_rate：说话速度，数据类型为字符串。
phonemes：音素，数据类型为字符串。
pitch：音高，数据类型为字符串。
noise：噪音，数据类型为字符串。
reverberation：回声，数据类型为字符串。
speech_monotony：语音单调性，数据类型为字符串。

数据集分割

训练集：包含25624个样本，总大小为5313435字节。
验证集：包含3145个样本，总大小为652832字节。
测试集：包含2640个样本，总大小为547656字节。

数据集大小

下载大小：2258102字节。
数据集总大小：6513923字节。

数据文件配置

默认配置：
- 训练集路径：data/train-*
- 验证集路径：data/valid-*
- 测试集路径：data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集