five

AdoCleanCode/hifitts2_audio_edit_mfa_v5

收藏
Hugging Face2025-10-21 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/AdoCleanCode/hifitts2_audio_edit_mfa_v5
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含语音文件及其对应转录信息的 数据集,每个样本都包含了说话者ID、FLAC文件名、完整转录文本、去除特定词汇的转录文本、完整音素序列、去除音素、注释音素等信息。数据集被分为多个批次,每个批次包含1000个样本,部分批次样本数量有所不同。

This dataset is a collection of audio files and their corresponding transcriptions, with each sample including speaker ID, FLAC filename, full transcription text, transcription text with specific words removed, full phoneme sequence, removed phonemes, annotated phonemes, and more. The dataset is divided into multiple batches, each containing 1000 samples, with some batches having a different number of samples.
提供机构:
AdoCleanCode
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作