five

DigitalUmuganda/common-voice-kinyarwanda-text-dataset

收藏
Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DigitalUmuganda/common-voice-kinyarwanda-text-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
kinyarwanda文本语料库是一个由Digital Umuganda创建的卢旺达语(rw)单语数据集,采用CC BY 4.0许可证。数据集大小在1百万到3百万之间,来源于原始数据,主要用于语言模型和自动语音识别任务。

kinyarwanda文本语料库是一个由Digital Umuganda创建的卢旺达语(rw)单语数据集,采用CC BY 4.0许可证。数据集大小在1百万到3百万之间,来源于原始数据,主要用于语言模型和自动语音识别任务。
提供机构:
DigitalUmuganda
原始信息汇总

数据集概述

基本信息

  • 名称: kinyarwanda text corpus
  • 语言: 卢旺达语(rw)
  • 许可证: CC-BY-4.0
  • 多语言性: 单语种
  • 大小: 1M<n<3M

创建者

  • 标注创建者: 众包
  • 语言创建者: Digital Umuganda

数据来源

  • 源数据集: 原始数据

任务类别

  • 任务类别:
    • 语言模型
    • 自动语音识别
  • 具体任务: 语言模型
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作