GrigoriiA/libretta-tts-merged-dataset-tags

Name: GrigoriiA/libretta-tts-merged-dataset-tags
Creator: GrigoriiA
Published: 2024-05-18 21:43:41
License: 暂无描述

Hugging Face2024-05-18 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/GrigoriiA/libretta-tts-merged-dataset-tags

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: file_name dtype: string - name: text dtype: string - name: transcription_normalised dtype: string - name: utterance_pitch_mean dtype: float32 - name: utterance_pitch_std dtype: float32 - name: snr dtype: float64 - name: c50 dtype: float64 - name: speaking_rate dtype: string - name: phonemes dtype: string - name: noise dtype: string - name: reverberation dtype: string - name: speech_monotony dtype: string - name: text_description dtype: string - name: gender dtype: string splits: - name: train num_bytes: 5097455 num_examples: 7596 download_size: 2135276 dataset_size: 5097455 configs: - config_name: default data_files: - split: train path: data/train-* ---

The dataset includes various speech-related features such as file name, text, normalized transcription, pitch statistics, signal-to-noise ratio, C50, speaking rate, phoneme analysis, noise, reverberation, speech monotony, text description, and speaker gender. It is primarily intended for training models, containing 7596 samples, with a download size of 2135276 bytes and an actual size of 5097455 bytes.

提供机构：

GrigoriiA

原始信息汇总

数据集概述

数据集特征

file_name：文件名，数据类型为字符串。
text：文本内容，数据类型为字符串。
transcription_normalised：规范化转录文本，数据类型为字符串。
utterance_pitch_mean：语音平均音高，数据类型为浮点数32位。
utterance_pitch_std：语音音高标准差，数据类型为浮点数32位。
snr：信噪比，数据类型为浮点数64位。
c50：C50指标，数据类型为浮点数64位。
speaking_rate：说话速率，数据类型为字符串。
phonemes：音素，数据类型为字符串。
noise：噪声类型，数据类型为字符串。
reverberation：混响类型，数据类型为字符串。
speech_monotony：语音单调性，数据类型为字符串。
text_description：文本描述，数据类型为字符串。
gender：说话人性别，数据类型为字符串。

数据集分割

训练集：包含7596个样本，总大小为5097455字节。

数据集大小

下载大小：2135276字节。
数据集总大小：5097455字节。

配置

默认配置：数据文件路径为data/train-*，对应于训练集。

5,000+

优质数据集

54 个

任务类型

进入经典数据集