iacon/jenny-tts-6h-tagged
收藏Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/iacon/jenny-tts-6h-tagged
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个与语音相关的特征,如文件名、文本内容、标准化转录、平均音高、音高标准差、信噪比、C50、语速、音素、噪声、混响、语音单调性和文本描述。数据集分为一个训练集,包含4000个样本,总大小为2260644字节,下载大小为1062429字节。
The dataset includes multiple features related to speech, such as file name, text, normalised transcription, mean pitch, pitch standard deviation, SNR, C50, speaking rate, phonemes, noise, reverberation, speech monotony, and text description. The dataset is divided into a training set containing 4000 samples, with a total size of 2260644 bytes and a download size of 1062429 bytes.
提供机构:
iacon
原始信息汇总
数据集概述
数据集特征
- file_name: 文件名,数据类型为字符串。
- text: 文本内容,数据类型为字符串。
- transcription_normalised: 标准化转录文本,数据类型为字符串。
- utterance_pitch_mean: 语音音调均值,数据类型为浮点数(float32)。
- utterance_pitch_std: 语音音调标准差,数据类型为浮点数(float32)。
- snr: 信噪比,数据类型为浮点数(float64)。
- c50: 未知特征,数据类型为浮点数(float64)。
- speaking_rate: 说话速率,数据类型为字符串。
- phonemes: 音素,数据类型为字符串。
- noise: 噪音,数据类型为字符串。
- reverberation: 混响,数据类型为字符串。
- speech_monotony: 语音单调性,数据类型为字符串。
- text_description: 文本描述,数据类型为字符串。
数据集分割
- train: 训练集,包含4000个样本,总大小为2260644字节。
数据集大小
- 下载大小: 1062429字节
- 数据集总大小: 2260644字节
配置
- default: 默认配置,数据文件路径为
data/train-*。



