Kirundi_Open_Speech_Dataset

Hugging Face2025-11-15 更新2025-11-16 收录

下载链接：

https://huggingface.co/datasets/samandari/Kirundi_Open_Speech_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个为Kirundi语言创建的第一个大规模开源语音和文本数据集，旨在促进语音识别、文本到语音、机器翻译和语音翻译等应用的开发。

This is the first large-scale open-source speech and text dataset created for the Kirundi language, designed to facilitate the development of applications such as speech recognition, text-to-speech, machine translation, and speech translation.

创建时间：

2025-11-11

原始信息汇总

🇧🇮 Kirundi Open Speech & Text Dataset 数据集概述

项目背景

Kirundi语言使用人数超过1200万，但仍属于低资源语言，被现代AI系统忽视。该项目旨在创建首个全面的、开源的Kirundi语音和文本数据集。

目标应用

🎙️ 语音转文本（ASR）：进行中
🗣️ 文本转语音（TTS）：计划中
🌐 机器翻译：计划中
🎧 语音翻译：计划中

数据集结构

元数据架构

列名	类型	描述	示例
file_path	字符串	音频文件相对路径	clips/rn_0001.wav
kirundi_transcription	字符串	Kirundi句子	Amahoro yImana abane nawe
french_translation	字符串	法语翻译	Que la paix de Dieu soit avec toi
speaker_id	字符串	匿名说话者标识	speaker_001
age	字符串	年龄组	20s, 30s, 40s+
gender	字符串	性别	male, female, other

目录结构

Kirundi_Dataset/ ├── README.md ├── metadata.csv ├── clips/ └── scripts/ ├── append_to_csv.py ├── scrapping_kirundi_words.py └── kirundi_prompts_scraped.txt

贡献方式

文本贡献（通过GitHub）

添加Kirundi句子到kirundi_prompts_scraped.txt文件
运行脚本添加到metadata.csv
提交GitHub Pull Request

翻译贡献（通过GitHub）

为metadata.csv中的空翻译列提供法语翻译
提交GitHub Pull Request

音频录制（通过Hugging Face）

录制Kirundi语音
保存为WAV或MP3格式
更新metadata.csv
提交Hugging Face Pull Request

技术规范

音频格式要求

主要格式：WAV（未压缩）
替代格式：MP3（高质量）
采样率：16kHz或22.05kHz
声道：单声道
位深度：16位

录制标准

环境：安静房间，无背景噪音
麦克风：头戴式麦克风或智能手机
说话风格：自然、清晰发音
准确性：按原文精确朗读

项目路线图

发展阶段

阶段	目标	状态	进度
阶段1	文本收集（10,000+句子）	进行中	5%
阶段2	法语翻译	计划中	0%
阶段3	音频录制（20+小时）	计划中	0%
阶段4	模型训练	计划中	0%
阶段5	公开发布	未来	0%

当前统计

📝 总句子数：180+
🎤 音频录制：0
🌐 翻译数：0
👥 贡献者：增长中

许可证

🔧 代码和脚本：MIT许可证
📊 数据集：CC BY 4.0许可证