five

ylacombe/libritts-r-descriptions-10k-v2

收藏
Hugging Face2024-04-29 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/ylacombe/libritts-r-descriptions-10k-v2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置:clean和other,每个配置详细描述了数据集的特征和分割信息。主要特征包括文本、原始文本、说话者ID、路径、章节ID、ID等,以及与语音相关的属性如说话速率、音素、SNR、音调等。数据集提供了不同分割的数据大小和示例数量,适用于语音处理和分析的研究。

该数据集包含两个配置:clean和other,每个配置详细描述了数据集的特征和分割信息。主要特征包括文本、原始文本、说话者ID、路径、章节ID、ID等,以及与语音相关的属性如说话速率、音素、SNR、音调等。数据集提供了不同分割的数据大小和示例数量,适用于语音处理和分析的研究。
提供机构:
ylacombe
原始信息汇总

数据集概述

配置名称:clean

  • 特征信息:

    • text: 字符串类型
    • text_original: 字符串类型
    • speaker_id: 字符串类型
    • path: 字符串类型
    • chapter_id: 字符串类型
    • id: 字符串类型
    • speaking_rate: 字符串类型
    • phonemes: 字符串类型
    • snr: float32类型
    • c50: float32类型
    • utterance_pitch_mean: float32类型
    • utterance_pitch_std: float32类型
    • gender: 字符串类型
    • pitch: 字符串类型
    • noise: 字符串类型
    • reverberation: 字符串类型
    • speech_monotony: 字符串类型
    • text_description: 字符串类型
  • 数据分割信息:

    • dev.clean: 5736个样本,4962453字节
    • test.clean: 4837个样本,4354781字节
    • train.clean.100: 33232个样本,29006018字节
    • train.clean.360: 116426个样本,102609887字节
  • 下载大小: 49065115字节

  • 数据集大小: 140933139字节

配置名称:other

  • 特征信息:

    • text: 字符串类型
    • text_original: 字符串类型
    • speaker_id: 字符串类型
    • path: 字符串类型
    • chapter_id: 字符串类型
    • id: 字符串类型
    • utterance_pitch_mean: float32类型
    • utterance_pitch_std: float32类型
    • snr: float64类型
    • c50: float64类型
    • speaking_rate: 字符串类型
    • phonemes: 字符串类型
    • gender: 字符串类型
    • pitch: 字符串类型
    • noise: 字符串类型
    • reverberation: 字符串类型
    • speech_monotony: 字符串类型
    • text_description: 字符串类型
  • 数据分割信息:

    • dev.other: 4613个样本,3856587字节
    • test.other: 5120个样本,4203646字节
    • train.other.500: 205035个样本,176441758字节
  • 下载大小: 62721077字节

  • 数据集大小: 184501991字节

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作