mwitiderrick/kitabucorpus
收藏Hugging Face2024-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mwitiderrick/kitabucorpus
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 2257692
num_examples: 32191
download_size: 0
dataset_size: 2257692
license: apache-2.0
task_categories:
- text-generation
language:
- sw
pretty_name: Kitabu Corpus
---
# Dataset Card for "kitabucorpus"
[Bookcorpus](https://huggingface.co/datasets/bookcorpus) in Swahili
提供机构:
mwitiderrick
原始信息汇总
数据集概述
名称: Bookcorpus in Swahili
描述: 该数据集包含Swahili语言的书籍内容,用于支持Swahili语言的自然语言处理研究和应用。



