GrigoriiA/libretta-tts-10k-tagged

Name: GrigoriiA/libretta-tts-10k-tagged
Creator: GrigoriiA
Published: 2024-05-15 02:55:56
License: 暂无描述

Hugging Face2024-05-15 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/GrigoriiA/libretta-tts-10k-tagged

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: file_name dtype: string - name: text dtype: string - name: transcription_normalised dtype: string - name: utterance_pitch_mean dtype: float32 - name: utterance_pitch_std dtype: float32 - name: snr dtype: float64 - name: c50 dtype: float64 - name: speaking_rate dtype: string - name: phonemes dtype: string - name: noise dtype: string - name: reverberation dtype: string - name: speech_monotony dtype: string - name: text_description dtype: string splits: - name: train num_bytes: 4892053 num_examples: 10000 download_size: 2150247 dataset_size: 4892053 configs: - config_name: default data_files: - split: train path: data/train-* ---

提供机构：

GrigoriiA

原始信息汇总

数据集概述

数据集特征

file_name：文件名，数据类型为字符串。
text：文本内容，数据类型为字符串。
transcription_normalised：规范化转录文本，数据类型为字符串。
utterance_pitch_mean：语音平均音高，数据类型为float32。
utterance_pitch_std：语音音高标准差，数据类型为float32。
snr：信噪比，数据类型为float64。
c50：特定声学参数，数据类型为float64。
speaking_rate：说话速率，数据类型为字符串。
phonemes：音素，数据类型为字符串。
noise：噪声类型，数据类型为字符串。
reverberation：混响类型，数据类型为字符串。
speech_monotony：语音单调性，数据类型为字符串。
text_description：文本描述，数据类型为字符串。

数据集划分

train：训练集，包含10000个样本，总大小为4892053字节。

数据集大小

下载大小：2150247字节
数据集总大小：4892053字节

配置

default：默认配置，训练数据路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集