five

McGill-NLP/african_celtic_dataset

收藏
Hugging Face2026-04-23 更新2026-02-07 收录
下载链接:
https://hf-mirror.com/datasets/McGill-NLP/african_celtic_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大规模的多语言语音语料库,专为语音到语音翻译、语音到文本以及多语言语音处理研究而设计。数据集包含约鲁巴语、伊博语、豪萨语和英语的语音数据,按语言、说话者和数据集分割(训练集、开发集)组织,并包含丰富的声学和元数据注释。数据集由McGill-NLP发布和维护,遵循Creative Commons Attribution 4.0 International (CC BY 4.0)许可协议。

This dataset is a large-scale multilingual speech corpus curated for speech-to-speech translation, speech-to-text, and multilingual speech processing research. The data is organized by language, speaker, and dataset split (train, dev), and includes rich acoustic and metadata annotations. The dataset is published and maintained by McGill-NLP under the Creative Commons Attribution 4.0 International (CC BY 4.0) license.
提供机构:
McGill-NLP
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作