five

mesolitica/Malaysian-Emilia-v2

收藏
Hugging Face2025-09-19 更新2025-09-13 收录
下载链接:
https://hf-mirror.com/datasets/mesolitica/Malaysian-Emilia-v2
下载链接
链接失效反馈
官方服务:
资源简介:
Malaysian Emilia v2是一个广泛、多语言和多样化的语音数据集,用于大规模马来西亚和新加坡语音生成。数据集包含了音频文件名、文件夹路径、文本、起始时间、结束时间、说话者、语言和dnsmos等特征。数据集分为sg_podcast、malaysia_parliament、malaysian_podcast和malaysian_cartoon四个部分,分别对应不同来源的数据。

Malaysian Emilia v2 is an extensive, multilingual, and diverse speech dataset for large-scale Malaysian and Singaporean speech generation. The dataset includes features such as audio filename, folder path, text, start time, end time, speaker, language, and dnsmos. It is split into four parts: sg_podcast, malaysia_parliament, malaysian_podcast, and malaysian_cartoon, each corresponding to data from different sources.
提供机构:
mesolitica
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作