GrigoriiA/libretta-tts-merged-dataset-tags-L10k

Name: GrigoriiA/libretta-tts-merged-dataset-tags-L10k
Creator: GrigoriiA
Published: 2024-05-19 22:15:59
License: 暂无描述

Hugging Face2024-05-19 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/GrigoriiA/libretta-tts-merged-dataset-tags-L10k

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: file_name dtype: string - name: text dtype: string - name: transcription_normalised dtype: string - name: utterance_pitch_mean dtype: float32 - name: utterance_pitch_std dtype: float32 - name: snr dtype: float64 - name: c50 dtype: float64 - name: speaking_rate dtype: string - name: phonemes dtype: string - name: noise dtype: string - name: reverberation dtype: string - name: speech_monotony dtype: string - name: text_description dtype: string - name: gender dtype: string splits: - name: train num_bytes: 8029544 num_examples: 13496 download_size: 3402348 dataset_size: 8029544 configs: - config_name: default data_files: - split: train path: data/train-* ---

This dataset includes various speech-related features such as file name, text, normalized transcription, pitch statistics, signal-to-noise ratio, C50, speaking rate, phoneme analysis, noise level, reverberation effect, speech monotony, text description, and speaker gender. The dataset is primarily for training, containing 13496 samples with a total size of 8029544 bytes.

提供机构：

GrigoriiA

原始信息汇总

数据集概述

数据集特征

file_name：文件名，数据类型为字符串。
text：文本内容，数据类型为字符串。
transcription_normalised：规范化转录，数据类型为字符串。
utterance_pitch_mean：语音平均音高，数据类型为float32。
utterance_pitch_std：语音音高标准差，数据类型为float32。
snr：信噪比，数据类型为float64。
c50：C50值，数据类型为float64。
speaking_rate：说话速度，数据类型为字符串。
phonemes：音素，数据类型为字符串。
noise：噪声类型，数据类型为字符串。
reverberation：混响类型，数据类型为字符串。
speech_monotony：语音单调性，数据类型为字符串。
text_description：文本描述，数据类型为字符串。
gender：性别，数据类型为字符串。

数据集划分

训练集（train）：
- 数据大小：8029544字节
- 示例数量：13496

数据集大小

下载大小：3402348字节
数据集总大小：8029544字节

配置

默认配置（default）：
- 数据文件路径：data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集