pharaouk/mls-eng-10k-tags_tagged_10k_generated
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/pharaouk/mls-eng-10k-tags_tagged_10k_generated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是对Multilingual LibriSpeech (MLS)数据集中10K小时英语子集的注释。MLS数据集是一个适用于语音研究的大型多语言语料库,包含8种语言的朗读有声书数据。该数据集特别关注英语部分,提供了丰富的注释信息,如说话者特征、语音特性等。数据集用于训练Parler-TTS Mini v0.1模型,并且所有相关资源都是开源的。
该数据集是对Multilingual LibriSpeech (MLS)数据集中10K小时英语子集的注释。MLS数据集是一个适用于语音研究的大型多语言语料库,包含8种语言的朗读有声书数据。该数据集特别关注英语部分,提供了丰富的注释信息,如说话者特征、语音特性等。数据集用于训练Parler-TTS Mini v0.1模型,并且所有相关资源都是开源的。
提供机构:
pharaouk
原始信息汇总
数据集概述
数据集名称: Annotations of 10K hours of English MLS
数据集描述: 本数据集包含10K小时的英语Multilingual LibriSpeech (MLS)数据集子集的注释。MLS数据集是一个适用于语音研究的大型多语言语料库,源自LibriVox的有声读物,包含8种语言,其中约44.5K小时为英语,其他语言总计约6K小时。
数据集特征:
- 数据类型: 字符串、浮点数、整数
- 特征列:
- original_path
- begin_time
- end_time
- audio_duration
- speaker_id
- book_id
- utterance_pitch_mean
- utterance_pitch_std
- snr
- c50
- speaking_rate
- phonemes
- gender
- pitch
- noise
- reverberation
- speech_monotony
- text_description
- original_text
- text
数据集分割:
- 训练集: 2420047个样本,2779317208字节
- 验证集: 3807个样本,4378721字节
- 测试集: 3769个样本,4360862字节
数据集大小: 下载大小为1438356670字节,数据集总大小为2788056791字节。
许可证: Creative Commons Attribution 4.0 International Public License (CC-BY-4.0)
任务类别: 自动语音识别、文本到语音、文本到音频
语言: 英语
多语言性: 多语言
数据集创建者:
- 注释创建者: 专家生成
- 语言创建者: 众包、专家生成
相关工作: 本数据集用于训练Parler-TTS Mini v0.1模型,并与原始版本和LibriTTS-R一起使用。
使用示例: python load_dataset("parler-tts/mls-eng-10k-tags_tagged_10k_generated", split="train")
流式加载支持: python load_dataset("parler-tts/libritts_r_tags_tagged_10k_generated", streaming=True)



