bxc2017epfl/jenny-tts-tags
收藏Hugging Face2024-07-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/bxc2017epfl/jenny-tts-tags
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频文件的相关信息,主要特征包括文件名、文本内容、标准化转录、平均音高、音高标准差、信噪比、C50、语速、音素、噪声、混响和语音单调性等。数据集仅包含训练集,大小为7797857字节,包含20978个样本。下载大小为4062512字节,数据集总大小为7797857字节。
This dataset contains information related to audio files, with main features including file name, text content, normalised transcription, mean pitch, pitch standard deviation, signal-to-noise ratio, C50, speaking rate, phonemes, noise, reverberation, and speech monotony. The dataset only includes a training set, with a size of 7797857 bytes and 20978 examples. The download size is 4062512 bytes, and the total dataset size is 7797857 bytes.
提供机构:
bxc2017epfl
原始信息汇总
数据集概述
数据集信息
特征
- file_name: 文件名,类型为字符串。
- text: 文本内容,类型为字符串。
- transcription_normalised: 标准化转录文本,类型为字符串。
- utterance_pitch_mean: 语音音调均值,类型为浮点数(float32)。
- utterance_pitch_std: 语音音调标准差,类型为浮点数(float32)。
- snr: 信噪比,类型为浮点数(float64)。
- c50: 未知特征,类型为浮点数(float64)。
- speaking_rate: 说话速率,类型为字符串。
- phonemes: 音素,类型为字符串。
- noise: 噪声,类型为字符串。
- reverberation: 混响,类型为字符串。
- speech_monotony: 语音单调性,类型为字符串。
数据分割
- train: 训练集,包含20978个样本,总大小为7797857字节。
数据集大小
- 下载大小: 4062512字节
- 数据集总大小: 7797857字节
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



