parler-tts/mls-eng-10k-tags_tagged_10k_generated
收藏Hugging Face2024-04-10 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/parler-tts/mls-eng-10k-tags_tagged_10k_generated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Multilingual LibriSpeech (MLS)数据集的10K小时英语子集的注释版本。MLS数据集是一个大型多语言语料库,适用于语音研究,包含来自LibriVox的有声读物,涵盖8种语言。该数据集包括对英语MLS的10K小时子集的注释,提供了关于说话者和话语特征的自然语言注释。数据集用于训练Parler-TTS Mini v0.1模型,并且是完全开源的,所有数据集、预处理代码、训练代码和权重都公开发布在宽松的许可证下。
提供机构:
parler-tts
原始信息汇总
数据集概述
数据集名称
- pretty_name: Annotations of 10K hours of English MLS
语言与创建者
- language: en (英语)
- annotations_creators: expert-generated
- language_creators: crowdsourced, expert-generated
许可
- license: cc-by-4.0
多语言性
- multilinguality: multilingual
任务类别
- task_categories: automatic-speech-recognition, text-to-speech, text-to-audio
数据集大小
- size_categories: 100K<n<1M
数据集来源
- source_datasets: original
数据集特征
- features:
- original_path (string)
- begin_time (float64)
- end_time (float64)
- audio_duration (float64)
- speaker_id (string)
- book_id (string)
- utterance_pitch_mean (float32)
- utterance_pitch_std (float32)
- snr (float64)
- c50 (float64)
- speaking_rate (string)
- phonemes (string)
- gender (string)
- pitch (string)
- noise (string)
- reverberation (string)
- speech_monotony (string)
- text_description (string)
- original_text (string)
- text (string)
数据集分割
- splits:
- dev: num_bytes=4378721, num_examples=3807
- test: num_bytes=4360862, num_examples=3769
- train: num_bytes=2779317208, num_examples=2420047
下载与数据集大小
- download_size: 1438356670
- dataset_size: 2788056791
配置
- configs:
- config_name: default
- data_files:
- split: dev, path: data/dev-*
- split: test, path: data/test-*
- split: train, path: data/train-*
- data_files:
- config_name: default



