five

pklumpp/CommonPhoneDataset

收藏
Hugging Face2025-10-14 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/pklumpp/CommonPhoneDataset
下载链接
链接失效反馈
官方服务:
资源简介:
Common Phone是一个多语言语音数据集,包含11650小时的语音样本,由11146位说话者在六种语言中收集而成。该数据集旨在为机器学习研究人员和爱好者提供一个基础,以训练和测试他们的模型,以改进机器学习在现实世界语音应用中的泛化能力和可用性。数据集支持六种不同的语言,提供时间对齐的国际音标(IPA)音位转录,以及性别平衡和年龄段匹配的说话者分布。

Common Phone is a multilingual speech dataset comprising 11650 hours of speech samples collected from 11146 speakers across six languages. This corpus is designed to provide a foundation for ML researchers and enthusiasts to train and test their models, improving the generalization and availability of ML in real-world speech applications. The dataset supports six different languages, offers time-aligned International Phonetic Alphabet (IPA) phonetic transcriptions, and features a gender-balanced and age-group-matched distribution of speakers.
提供机构:
pklumpp
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作