gentaiscool/bitext_nollysenti_miners
收藏Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/gentaiscool/bitext_nollysenti_miners
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种语言配置,包括英语、豪萨语、伊博语、尼日利亚皮钦语和约鲁巴语。每个配置都有对应的数据文件路径,用于训练数据。数据集的许可为cc-by-sa-4.0。
This dataset includes multiple language configurations, such as English, Hausa, Igbo, Nigerian Pidgin, and Yoruba. Each configuration has corresponding data file paths for training data. The dataset is licensed under cc-by-sa-4.0.
提供机构:
gentaiscool
原始信息汇总
数据集概述
许可证
- CC BY-SA 4.0
语言
- 英语 (en)
- 豪萨语 (ha)
- 伊博语 (ig)
- 尼日利亚皮钦语 (pcm)
- 约鲁巴语 (yo)
配置
- default
- 数据文件:
- 训练集:
train/*
- 训练集:
- 数据文件:
- en-ha
- 数据文件:
- 训练集:
train/en-ha.jsonl
- 训练集:
- 数据文件:
- en-ig
- 数据文件:
- 训练集:
train/en-ig.jsonl
- 训练集:
- 数据文件:
- en-pcm
- 数据文件:
- 训练集:
train/en-pcm.jsonl
- 训练集:
- 数据文件:
- en-yo
- 数据文件:
- 训练集:
train/en-yo.jsonl
- 训练集:
- 数据文件:



