five

parler-tts/mls-eng-10k-tags_tagged_10k_generated

收藏
Hugging Face2024-04-10 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/parler-tts/mls-eng-10k-tags_tagged_10k_generated
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Multilingual LibriSpeech (MLS)数据集的10K小时英语子集的注释版本。MLS数据集是一个大型多语言语料库,适用于语音研究,包含来自LibriVox的有声读物,涵盖8种语言。该数据集包括对英语MLS的10K小时子集的注释,提供了关于说话者和话语特征的自然语言注释。数据集用于训练Parler-TTS Mini v0.1模型,并且是完全开源的,所有数据集、预处理代码、训练代码和权重都公开发布在宽松的许可证下。
提供机构:
parler-tts
原始信息汇总

数据集概述

数据集名称

  • pretty_name: Annotations of 10K hours of English MLS

语言与创建者

  • language: en (英语)
  • annotations_creators: expert-generated
  • language_creators: crowdsourced, expert-generated

许可

  • license: cc-by-4.0

多语言性

  • multilinguality: multilingual

任务类别

  • task_categories: automatic-speech-recognition, text-to-speech, text-to-audio

数据集大小

  • size_categories: 100K<n<1M

数据集来源

  • source_datasets: original

数据集特征

  • features:
    • original_path (string)
    • begin_time (float64)
    • end_time (float64)
    • audio_duration (float64)
    • speaker_id (string)
    • book_id (string)
    • utterance_pitch_mean (float32)
    • utterance_pitch_std (float32)
    • snr (float64)
    • c50 (float64)
    • speaking_rate (string)
    • phonemes (string)
    • gender (string)
    • pitch (string)
    • noise (string)
    • reverberation (string)
    • speech_monotony (string)
    • text_description (string)
    • original_text (string)
    • text (string)

数据集分割

  • splits:
    • dev: num_bytes=4378721, num_examples=3807
    • test: num_bytes=4360862, num_examples=3769
    • train: num_bytes=2779317208, num_examples=2420047

下载与数据集大小

  • download_size: 1438356670
  • dataset_size: 2788056791

配置

  • configs:
    • config_name: default
      • data_files:
        • split: dev, path: data/dev-*
        • split: test, path: data/test-*
        • split: train, path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作