thai-tts-dataset
收藏Hugging Face2026-03-19 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/doyze/thai-tts-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个高质量的泰语语音数据集,专为泰语文本到语音(TTS)模型的微调而设计。数据集内容来源于YouTube播客,包含4,621个语音片段(训练集4,390个,验证集231个)。音频格式为WAV,采样率22050Hz,单声道,16位。每个样本包含三个字段:音频文件、对应的泰语文本(使用Whisper large-v3模型转录,置信度≥0.7)和文件名。数据集采用与LJSpeech兼容的格式,适用于泰语语音合成研究、TTS模型(如VITS、F5-TTS、XTTS v2)的微调以及泰语自动语音识别(ASR)评估。数据通过自动化流程处理,包括YouTube音频下载、格式转换、语音活动检测、语音转录和质量控制等步骤。数据集仅限研究和个人使用,内容版权归原始YouTube频道所有。
创建时间:
2026-03-17



