pharaouk/mls-eng-10k-tags_tagged_10k_generated

Name: pharaouk/mls-eng-10k-tags_tagged_10k_generated
Creator: pharaouk
Published: 2024-04-11 06:47:44
License: 暂无描述

Hugging Face2024-04-11 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/pharaouk/mls-eng-10k-tags_tagged_10k_generated

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是对Multilingual LibriSpeech (MLS)数据集中10K小时英语子集的注释。MLS数据集是一个适用于语音研究的大型多语言语料库，包含8种语言的朗读有声书数据。该数据集特别关注英语部分，提供了丰富的注释信息，如说话者特征、语音特性等。数据集用于训练Parler-TTS Mini v0.1模型，并且所有相关资源都是开源的。

提供机构：

pharaouk

原始信息汇总

数据集概述

数据集名称: Annotations of 10K hours of English MLS

数据集描述: 本数据集包含10K小时的英语Multilingual LibriSpeech (MLS)数据集子集的注释。MLS数据集是一个适用于语音研究的大型多语言语料库，源自LibriVox的有声读物，包含8种语言，其中约44.5K小时为英语，其他语言总计约6K小时。

数据集特征:

数据类型: 字符串、浮点数、整数
特征列:
- original_path
- begin_time
- end_time
- audio_duration
- speaker_id
- book_id
- utterance_pitch_mean
- utterance_pitch_std
- snr
- c50
- speaking_rate
- phonemes
- gender
- pitch
- noise
- reverberation
- speech_monotony
- text_description
- original_text
- text

数据集分割:

训练集: 2420047个样本，2779317208字节
验证集: 3807个样本，4378721字节
测试集: 3769个样本，4360862字节

数据集大小: 下载大小为1438356670字节，数据集总大小为2788056791字节。

许可证: Creative Commons Attribution 4.0 International Public License (CC-BY-4.0)

任务类别: 自动语音识别、文本到语音、文本到音频

语言: 英语

多语言性: 多语言

数据集创建者:

注释创建者: 专家生成
语言创建者: 众包、专家生成

相关工作: 本数据集用于训练Parler-TTS Mini v0.1模型，并与原始版本和LibriTTS-R一起使用。

使用示例: python load_dataset("parler-tts/mls-eng-10k-tags_tagged_10k_generated", split="train")

流式加载支持: python load_dataset("parler-tts/libritts_r_tags_tagged_10k_generated", streaming=True)

5,000+

优质数据集

54 个

任务类型

进入经典数据集