Inioluwa/nigerianLanguageTranslator
收藏Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/Inioluwa/nigerianLanguageTranslator
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于翻译任务的双语数据集,包含英语和Nupe语的文本对。数据集分为训练集和测试集,训练集包含231,156个样本,测试集包含57,790个样本。数据集的下载大小为15,924,785字节,总大小为22,389,501字节。数据集的许可证为Creative Commons(cc),适用于翻译任务,涉及的语言为英语和Nupe语。数据集的标签包括code,并且数据集的大小类别为100K到1M之间。
This dataset includes two main features: eng and nupe, both of which are string types. The dataset is divided into a training set and a test set, containing 231156 and 57790 samples respectively. The dataset is used for translation tasks, involving English and Yoruba languages. The dataset is named english-nupe, falls into the 100K<n<1M size category, and is licensed under CC.
提供机构:
Inioluwa
原始信息汇总
数据集概述
数据集信息
-
特征:
eng: 数据类型为字符串nupe: 数据类型为字符串
-
分割:
train:- 字节数: 17911538.810559757
- 样本数: 231156
test:- 字节数: 4477962.189440241
- 样本数: 57790
-
下载大小: 15924785 字节
-
数据集大小: 22389501 字节
配置
- 配置名称:
default- 数据文件:
train:data/train-*test:data/test-*
- 数据文件:
其他信息
- 许可证:
cc - 任务类别:
translation - 语言:
en,yo - 标签:
code - 名称:
english-nupe - 大小类别:
100K<n<1M



