cdminix/libritts-r-aligned
收藏数据集概述
名称: LibriTTS Corpus with Forced Alignments
语言: 英语 (en)
标签:
- 语音 (speech)
- 音频 (audio)
- 自动语音识别 (automatic-speech-recognition)
- 文本到语音 (text-to-speech)
许可证: CC-BY-4.0
任务类别:
- 自动语音识别
- 文本到语音
数据集内容
数据预处理: 数据集下载LibriTTS-R并在本地机器上使用montreal forced aligner创建对齐。
要求:
- 必须安装
alignments和phones(pip install alignments phones) - 可选安装
speech-collator(pip install speech-collator)
示例数据项: json { id: 100_122655_000073_000002.wav, speaker: 100, text: the day after, diana and mary quitted it for distant b., start: 0.0, end: 3.6500000953674316, phones: [[SILENCE], ð, ʌ, [SILENCE], d, eɪ, [SILENCE], æ, f, t, ɜ˞, [COMMA], d, aɪ, æ, n, ʌ, [SILENCE], æ, n, d, [SILENCE], m, ɛ, ɹ, i, [SILENCE], k, w, ɪ, t, ɪ, d, [SILENCE], ɪ, t, [SILENCE], f, ɜ˞, [SILENCE], d, ɪ, s, t, ʌ, n, t, [SILENCE], b, i, [FULL STOP]], phone_durations: [5, 2, 4, 0, 5, 13, 0, 16, 7, 5, 20, 2, 6, 9, 15, 4, 2, 0, 11, 3, 5, 0, 3, 8, 9, 8, 0, 13, 3, 5, 3, 6, 4, 0, 8, 5, 0, 9, 5, 0, 7, 5, 6, 7, 4, 5, 10, 0, 3, 35, 9], audio: /dev/shm/metts/train-clean-360-alignments/100/100_122655_000073_000002.wav }
数据集分割
train: 所有训练数据,除每个说话者的一个样本用于验证。dev: 验证数据,每个说话者一个样本。train.clean.100: 从LibriSpeech的train-clean-100子集中派生的训练集。train.clean.360: 从LibriSpeech的train-clean-360子集中派生的训练集。train.other.500: 从LibriSpeech的train-other-500子集中派生的训练集。dev.clean: 从LibriSpeech的dev-clean子集中派生的验证集。dev.other: 从LibriSpeech的dev-other子集中派生的验证集。test.clean: 从LibriSpeech的test-clean子集中派生的测试集。test.other: 从LibriSpeech的test-other子集中派生的测试集。
环境变量
LIBRITTS_VERBOSE: 如果设置,将打印更多关于数据集创建过程的信息。LIBRITTS_MAX_WORKERS: 创建对齐时使用的工人数量。默认为cpu_count()。LIBRITTS_PATH: 下载LibriTTS的路径。默认为HF_DATASETS_CACHE的值。
引用




