cdminix/libritts-aligned

Name: cdminix/libritts-aligned
Creator: cdminix
Published: 2024-04-26 08:19:59
License: 暂无描述

Hugging Face2024-04-26 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/cdminix/libritts-aligned

下载链接

链接失效反馈

官方服务：

资源简介：

LibriTTS Corpus with Forced Alignments数据集是一个用于自动语音识别（ASR）和文本到语音（TTS）任务的语音数据集。它包含音频文件、对应的文本、音素及其持续时间等信息。数据集提供了预处理的对齐信息，用户无需本地运行Montreal Forced Aligner。数据集还附带了一个数据整理器（data collator），用于创建训练批次数据。数据集分为多个子集，如train、dev、test等，分别对应LibriSpeech的不同子集。

提供机构：

cdminix

原始信息汇总

数据集概述

名称: LibriTTS Corpus with Forced Alignments

描述: 该数据集包含语音数据的强制对齐信息，适用于自动语音识别（ASR）和文本到语音（TTS）任务。

数据集详细信息

语言: 英语（en）

标签:

语音（speech）
音频（audio）
自动语音识别（automatic-speech-recognition）
文本到语音（text-to-speech）

许可证: CC-BY-4.0

任务类别:

自动语音识别
文本到语音

数据集内容:

每个数据项包含音频文件的ID、说话者信息、文本内容、开始和结束时间、音素及其持续时间、音频文件路径。
音素使用国际音标（IPA）表示，音素持续时间以帧为单位。

数据集分割:

train: 除每个说话者的一个样本用于验证外的所有训练数据。
dev: 每个说话者的一个样本用于验证。
train.clean.100, train.clean.360, train.other.500: 分别从LibriSpeech的不同子集中提取的训练数据。
dev.clean, dev.other: 分别从LibriSpeech的不同子集中提取的验证数据。
test.clean, test.other: 分别从LibriSpeech的不同子集中提取的测试数据。