Tommy0201/Igbo_To_Eng
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Tommy0201/Igbo_To_Eng
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含伊博语和英语的翻译对,数据来源于BBC Igbo、Igbo.gov和Ted Talk Igbo。数据集分为训练集、评估集和测试集,分别包含111876、997和1012个样本。数据集的总下载大小为16633767字节,总数据集大小为26252051字节。数据集的任务类别为翻译,涉及的语言为伊博语和英语,数据规模在100K到1M之间。
该数据集包含伊博语和英语的翻译对,数据来源于BBC Igbo、Igbo.gov和Ted Talk Igbo。数据集分为训练集、评估集和测试集,分别包含111876、997和1012个样本。数据集的总下载大小为16633767字节,总数据集大小为26252051字节。数据集的任务类别为翻译,涉及的语言为伊博语和英语,数据规模在100K到1M之间。
提供机构:
Tommy0201
原始信息汇总
数据集概述
数据集信息
-
特征:
igbo: 类型为stringenglish: 类型为string
-
分割:
train:- 字节数: 25663786
- 样本数: 111876
eval:- 字节数: 285029
- 样本数: 997
test:- 字节数: 303236
- 样本数: 1012
-
下载大小: 16633767 字节
-
数据集大小: 26252051 字节
数据来源
- BBC Igbo
- Igbo.gov
- Ted Talk Igbo
配置
- 配置名称:
default- 数据文件:
train:data/train-*eval:data/eval-*test:data/test-*
- 数据文件:
任务类别
- 翻译
语言
igen
数据集规模
- 100K < n < 1M



