AfricanVoices

github2023-06-01 更新2024-05-31 收录

下载链接：

https://github.com/neulab/AfricanVoices

下载链接

链接失效反馈

官方服务：

资源简介：

AfricanVoices项目旨在通过创建和收集高质量的非洲语言语音数据集，促进非洲语言的语音合成研究。该项目还提供了自建的语音合成器供他人使用，并欢迎任何人参与贡献。

The AfricanVoices project aims to advance research in speech synthesis for African languages by creating and collecting high-quality speech datasets. Additionally, the project offers a self-developed speech synthesizer for public use and welcomes contributions from anyone interested.

创建时间：

2022-02-01

原始信息汇总

数据集概述

数据集名称

AfricanVoices

项目目的

增加非洲语言的语音合成研究，创建和收集高质量的非洲语言语音数据集，并提供已构建的合成器供他人使用。

涉及语言及数据量

语言	语言代码	数据来源	语音条数	时长(小时)
Luo	luo	Open.Bible	11263	15.92
Lingala	lin	Open.Bible	12957	27.52
Kikuyu	kik	Open.Bible	10877	17.72
Yoruba	yor	Open.Bible	10978	18.04
Hausa-M	hau	CommonVoice	518	0.62
Hausa-F	hau	CommonVoice	1938	2.3
Luganda	lug	CommonVoice	2942	4.52
Ibibio	ibb	LLSTI	125	0.32
Kiswahili	swa	LLSTI	426	0.53
Wolof	wol	ALFFA	1000	1.2
Fongbe	fon	ALFFA	542	0.33
Suba	sxb	Bible.is	11971	24.82
Suba	sxb	AfricanVoices	1178	1.7
Luo	luo	AfricanVoices	1516	1.79
English (Kenyan)	en-ke	AfricanVoices	593	0.74

数据来源

Open.Bible
Faith comes by hearing (Bible.is)
LLSTI
Mozilla CommonVoice
ALFFA

许可证

AfricanVoices创建的数据集（Kenyan English, Suba和Luo）遵循Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0)。
第三方数据集遵循其原始许可证。

贡献方式

提供语言数据集
提供训练的合成器
提供数字字典
改进文档或代码
评估合成器输出

搜集汇总

数据集介绍

构建方式

AfricanVoices数据集通过整合多种来源的语音数据构建而成，涵盖了多种非洲语言。数据来源包括Open.Bible、Faith comes by hearing、LLSTI、Mozilla CommonVoice和ALFFA等项目。这些数据经过对齐和转换处理，确保语音与文本的精确匹配。此外，AfricanVoices团队还自行录制了部分语言的数据，如Suba和Luo，并通过开源工具进行音频格式转换和标注。

特点

AfricanVoices数据集的特点在于其多样性和高质量。它涵盖了多种非洲语言，如Luo、Lingala、Kikuyu等，每种语言的数据量从数百到上万条不等，总时长超过100小时。数据集不仅包含语音数据，还提供了数字字典，用于文本归一化处理。此外，数据集还附带了语音合成器的构建指南，便于研究人员进行进一步开发。

使用方法

AfricanVoices数据集的使用方法灵活多样。研究人员可以通过AfricanVoices网站下载数据集和语音合成器。数据集适用于语音合成、语音识别等领域的研究。对于长音频文件的对齐，可以参考项目提供的对齐指南。此外，数据集还支持用户贡献新的语言数据或改进现有数据，促进非洲语言语音技术的进一步发展。

背景与挑战

背景概述

AfricanVoices项目旨在通过创建和收集高质量的非洲语言语音数据集，推动非洲语言的语音合成研究。该项目由多个研究机构和学者共同参与，主要研究人员包括来自卡内基梅隆大学等机构的学者。项目自2022年起逐步推进，涵盖了多种非洲语言，如Luo、Lingala、Kikuyu等。通过整合来自Open.Bible、CommonVoice、LLSTI等数据源的语音数据，AfricanVoices为非洲语言的语音技术研究提供了重要资源。该项目的成果已在Interspeech 2022等国际会议上发表，对非洲语言的语音合成和自动语音识别领域产生了深远影响。

当前挑战

AfricanVoices项目面临的主要挑战包括数据稀缺性和多样性问题。非洲语言的语音数据相对匮乏，且分布不均，导致构建高质量数据集时面临数据量不足的困境。此外，数据对齐和标注的复杂性也是构建过程中的一大挑战，尤其是在处理长音频文件（如圣经录音）时，需要精确的语音-文本对齐技术。项目还需应对不同数据源的许可限制，确保数据的合法使用。在语音合成模型的训练中，如何有效利用有限的语音数据，提升模型的泛化能力，也是亟待解决的技术难题。

常用场景

经典使用场景

AfricanVoices数据集在语音合成领域具有重要应用，特别是在非洲语言的语音合成研究中。该数据集通过收集和创建高质量的非洲语言语音数据，为研究人员提供了丰富的资源，用于训练和测试语音合成模型。其经典使用场景包括开发多语言语音合成系统，尤其是在资源匮乏的非洲语言环境中，填补了语音技术研究的空白。

解决学术问题

AfricanVoices数据集解决了非洲语言语音合成研究中数据稀缺的核心问题。通过提供多种非洲语言的语音数据，该数据集为研究人员提供了基础资源，支持了语音合成模型的开发与优化。此外，数据集还促进了跨语言语音技术的研究，推动了语音合成技术在低资源语言中的应用，具有重要的学术意义和广泛的研究影响。

衍生相关工作

AfricanVoices数据集衍生了一系列经典研究工作，特别是在低资源语言语音合成领域。例如，基于该数据集的研究推动了非洲语言语音合成模型的开发，如Luo、Lingala和Yoruba等语言的语音合成系统。此外，数据集还激发了跨语言语音技术的研究，为语音合成技术在更多语言环境中的应用提供了理论支持和技术参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集