eastwind/parler_libritts_r_10k_merged

Name: eastwind/parler_libritts_r_10k_merged
Creator: eastwind
Published: 2024-06-19 23:16:10
License: 暂无描述

Hugging Face2024-06-19 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/eastwind/parler_libritts_r_10k_merged

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个与语音相关的特征，如文本、原始文本、说话者ID、路径、章节ID、ID、语速、音素、信噪比、C50、平均音高、音高标准差、性别、音高、噪声、混响、语音单调性、文本描述、音频、归一化文本和元数据ID。数据集分为训练集和测试集，训练集包含299,316个样本，测试集包含10,240个样本。音频的采样率为24,000 Hz。

This dataset contains multiple features related to speech, such as text, original text, speaker ID, path, chapter ID, ID, speaking rate, phonemes, SNR, C50, mean pitch, pitch standard deviation, gender, pitch, noise, reverberation, speech monotony, text description, audio, normalized text, and metadata ID. The dataset is divided into a training set and a test set, with the training set containing 299,316 samples and the test set containing 10,240 samples. The audio sampling rate is 24,000 Hz.

提供机构：

eastwind

原始信息汇总

数据集概述

数据集特征

text: 文本数据，类型为字符串。
text_original: 原始文本数据，类型为字符串。
speaker_id: 说话者ID，类型为字符串。
path: 文件路径，类型为字符串。
chapter_id: 章节ID，类型为字符串。
id: 标识符，类型为字符串。
speaking_rate: 说话速率，类型为字符串。
phonemes: 音素，类型为字符串。
snr: 信噪比，类型为浮点数（float32）。
c50: C50值，类型为浮点数（float32）。
utterance_pitch_mean: 语句音调均值，类型为浮点数（float32）。
utterance_pitch_std: 语句音调标准差，类型为浮点数（float32）。
gender: 性别，类型为字符串。
pitch: 音调，类型为字符串。
noise: 噪声，类型为字符串。
reverberation: 混响，类型为字符串。
speech_monotony: 语音单调性，类型为字符串。
text_description: 文本描述，类型为字符串。
audio: 音频数据，采样率为24000。
text_normalized: 归一化文本，类型为字符串。
metadata_id: 元数据ID，类型为字符串。

数据集分割

train: 训练集，包含299316个样本，大小为84612933978.504字节。
test: 测试集，包含10240个样本，大小为2309981594.64字节。

数据集大小

下载大小: 86535600238字节。
总大小: 86922915573.144字节。

配置

config_name: default
- data_files:
  - train: 路径为data/train-*。
  - test: 路径为data/test-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集