wolof_tts

Hugging Face2024-08-27 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/galsenai/wolof_tts

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个Wolof语言的文本到语音（TTS）数据集，由Baamtu Datamation收集，作为AI4D非洲语言项目的一部分。数据集包含来自两名母语为Wolof的说话者的录音，一男一女，每位说话者录制了超过20,000个句子。录音时间分别为男性22小时28分钟41秒和女性18小时47分钟19秒。文本数据来自新闻网站、维基百科和自定义文本。数据集在Zenodo上托管，并由GalsenAI通过HuggingFace平台提供，以加强塞内加尔的AI生态系统。

创建时间：

2024-08-26

原始信息汇总

Wolof TTS 数据集概述

数据集描述

Wolof TTS 数据集是由 Baamtu Datamation 作为 AI4D African language program 的一部分收集的 Wolof 语言的文本到语音（TTS）数据集。该数据集最初托管在 Zenodo 上，包含两名母语为 Wolof 的发言人的录音（一名男性和一名女性）。每位发言者录制了超过 20,000 句话。

发言时间

男性：22小时28分钟41秒
女性：18小时47分钟19秒

文本数据来自新闻网站、维基百科和自定义文本。

数据集信息

特征：
- audio：采样率为 16000
- text：字符串类型
- gender：字符串类型
分割：
- train：包含 36009 个样本，大小为 4274917077.83 字节
- test：包含 4001 个样本，大小为 475541653.87 字节
下载大小：4571561616 字节
数据集大小：4750458731.7 字节
配置：
- default：
  - train：路径为 data/train-*
  - test：路径为 data/test-*
许可：cc-by-4.0
任务类别：text-to-speech
语言：wo
名称：woloftts
大小类别：10K<n<100K

引用

如果您使用该数据集，请引用以下论文：

@dataset{thierno_ibrahima_diop_2021_4498861, author = {Thierno Ibrahima Diop and Demba AW and Ami jaane and Mamadou Badiane}, title = {WOLOF TTS(Text To Speech) Data}, month = feb, year = 2021, publisher = {Zenodo}, version = 1, doi = {10.5281/zenodo.4498861}, url = {https://doi.org/10.5281/zenodo.4498861} }

搜集汇总

数据集介绍

构建方式

Wolof TTS数据集由Baamtu Datamation在AI4D非洲语言项目框架下构建，旨在支持沃洛夫语的文本到语音转换研究。该数据集包含两位母语沃洛夫语者的录音，分别为男性和女性，每位说话者录制了超过20,000个句子。文本数据来源于新闻网站、维基百科以及自编文本，确保了数据的多样性和广泛性。录音总时长男性为22小时28分钟41秒，女性为18小时47分钟19秒。

特点

Wolof TTS数据集的特点在于其高质量的音频和文本配对，采样率为16000Hz，确保了语音的清晰度和自然度。数据集分为训练集和测试集，训练集包含36,009个样本，测试集包含4,001个样本，总数据量约为4.75GB。此外，数据集还标注了说话者的性别信息，为研究性别对语音特征的影响提供了便利。

使用方法

Wolof TTS数据集适用于文本到语音转换模型的训练和评估。用户可以通过HuggingFace平台下载数据集，并利用其提供的API进行数据加载和预处理。数据集的结构化格式使得用户能够轻松地将其集成到现有的机器学习框架中。此外，数据集的使用应遵循CC-BY-4.0许可协议，确保在学术和商业应用中的合规性。

背景与挑战

背景概述

Wolof TTS数据集是由Baamtu Datamation在AI4D非洲语言项目框架下创建的，旨在推动非洲语言的语音合成技术发展。该数据集于2021年发布，包含两名沃洛夫语母语者的录音，分别来自男性和女性，总录音时长超过40小时。数据来源包括新闻网站、维基百科以及自编文本，涵盖了丰富的语言表达形式。该数据集为沃洛夫语的语音合成研究提供了重要资源，填补了非洲语言在语音技术领域的空白，对促进语言多样性和技术包容性具有重要意义。

当前挑战

Wolof TTS数据集面临的挑战主要体现在两个方面。首先，沃洛夫语作为一种资源稀缺的语言，其语音数据的收集和标注存在较大难度，尤其是在确保语音质量和文本多样性方面。其次，数据集的构建过程中需要克服技术障碍，例如录音环境的噪声控制、语音对齐的精确性以及文本与语音的匹配问题。此外，由于沃洛夫语的语法和发音特点，开发高效的语音合成模型需要针对性的算法优化，这对研究者的技术能力提出了更高要求。

常用场景

经典使用场景

Wolof TTS数据集在语音合成领域具有广泛的应用，尤其是在非洲语言的语音合成研究中。该数据集包含了来自两位母语为沃洛夫语的说话者的录音，涵盖了超过40,000个句子，为研究人员提供了丰富的语音和文本对。这些数据可以用于训练和评估文本到语音（TTS）模型，特别是在低资源语言的语音合成任务中，帮助提升模型的自然度和准确性。

衍生相关工作

Wolof TTS数据集的发布催生了一系列相关研究工作，特别是在低资源语言的语音合成领域。许多研究团队利用该数据集开发了新的TTS模型，并发表了相关论文。这些工作不仅推动了沃洛夫语语音技术的发展，还为其他低资源语言的语音合成研究提供了宝贵的经验和参考。此外，该数据集还被用于多语言语音合成系统的开发，进一步扩展了其应用范围。

数据集最近研究