ylacombe/libritts-r-descriptions-10k-v2
收藏Hugging Face2024-04-29 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/ylacombe/libritts-r-descriptions-10k-v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置:clean和other,每个配置详细描述了数据集的特征和分割信息。主要特征包括文本、原始文本、说话者ID、路径、章节ID、ID等,以及与语音相关的属性如说话速率、音素、SNR、音调等。数据集提供了不同分割的数据大小和示例数量,适用于语音处理和分析的研究。
该数据集包含两个配置:clean和other,每个配置详细描述了数据集的特征和分割信息。主要特征包括文本、原始文本、说话者ID、路径、章节ID、ID等,以及与语音相关的属性如说话速率、音素、SNR、音调等。数据集提供了不同分割的数据大小和示例数量,适用于语音处理和分析的研究。
提供机构:
ylacombe
原始信息汇总
数据集概述
配置名称:clean
-
特征信息:
- text: 字符串类型
- text_original: 字符串类型
- speaker_id: 字符串类型
- path: 字符串类型
- chapter_id: 字符串类型
- id: 字符串类型
- speaking_rate: 字符串类型
- phonemes: 字符串类型
- snr: float32类型
- c50: float32类型
- utterance_pitch_mean: float32类型
- utterance_pitch_std: float32类型
- gender: 字符串类型
- pitch: 字符串类型
- noise: 字符串类型
- reverberation: 字符串类型
- speech_monotony: 字符串类型
- text_description: 字符串类型
-
数据分割信息:
- dev.clean: 5736个样本,4962453字节
- test.clean: 4837个样本,4354781字节
- train.clean.100: 33232个样本,29006018字节
- train.clean.360: 116426个样本,102609887字节
-
下载大小: 49065115字节
-
数据集大小: 140933139字节
配置名称:other
-
特征信息:
- text: 字符串类型
- text_original: 字符串类型
- speaker_id: 字符串类型
- path: 字符串类型
- chapter_id: 字符串类型
- id: 字符串类型
- utterance_pitch_mean: float32类型
- utterance_pitch_std: float32类型
- snr: float64类型
- c50: float64类型
- speaking_rate: 字符串类型
- phonemes: 字符串类型
- gender: 字符串类型
- pitch: 字符串类型
- noise: 字符串类型
- reverberation: 字符串类型
- speech_monotony: 字符串类型
- text_description: 字符串类型
-
数据分割信息:
- dev.other: 4613个样本,3856587字节
- test.other: 5120个样本,4203646字节
- train.other.500: 205035个样本,176441758字节
-
下载大小: 62721077字节
-
数据集大小: 184501991字节



