five

pharaouk/mls-eng-10k-tags_tagged_10k_generated

收藏
Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/pharaouk/mls-eng-10k-tags_tagged_10k_generated
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是对Multilingual LibriSpeech (MLS)数据集中10K小时英语子集的注释。MLS数据集是一个适用于语音研究的大型多语言语料库,包含8种语言的朗读有声书数据。该数据集特别关注英语部分,提供了丰富的注释信息,如说话者特征、语音特性等。数据集用于训练Parler-TTS Mini v0.1模型,并且所有相关资源都是开源的。

该数据集是对Multilingual LibriSpeech (MLS)数据集中10K小时英语子集的注释。MLS数据集是一个适用于语音研究的大型多语言语料库,包含8种语言的朗读有声书数据。该数据集特别关注英语部分,提供了丰富的注释信息,如说话者特征、语音特性等。数据集用于训练Parler-TTS Mini v0.1模型,并且所有相关资源都是开源的。
提供机构:
pharaouk
原始信息汇总

数据集概述

数据集名称: Annotations of 10K hours of English MLS

数据集描述: 本数据集包含10K小时英语Multilingual LibriSpeech (MLS)数据集子集的注释。MLS数据集是一个适用于语音研究的大型多语言语料库,源自LibriVox的有声读物,包含8种语言,其中约44.5K小时为英语,其他语言总计约6K小时。

数据集特征:

  • 数据类型: 字符串、浮点数、整数
  • 特征列:
    • original_path
    • begin_time
    • end_time
    • audio_duration
    • speaker_id
    • book_id
    • utterance_pitch_mean
    • utterance_pitch_std
    • snr
    • c50
    • speaking_rate
    • phonemes
    • gender
    • pitch
    • noise
    • reverberation
    • speech_monotony
    • text_description
    • original_text
    • text

数据集分割:

  • 训练集: 2420047个样本,2779317208字节
  • 验证集: 3807个样本,4378721字节
  • 测试集: 3769个样本,4360862字节

数据集大小: 下载大小为1438356670字节,数据集总大小为2788056791字节。

许可证: Creative Commons Attribution 4.0 International Public License (CC-BY-4.0)

任务类别: 自动语音识别、文本到语音、文本到音频

语言: 英语

多语言性: 多语言

数据集创建者:

  • 注释创建者: 专家生成
  • 语言创建者: 众包、专家生成

相关工作: 本数据集用于训练Parler-TTS Mini v0.1模型,并与原始版本LibriTTS-R一起使用。

使用示例: python load_dataset("parler-tts/mls-eng-10k-tags_tagged_10k_generated", split="train")

流式加载支持: python load_dataset("parler-tts/libritts_r_tags_tagged_10k_generated", streaming=True)

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作