VanessaSchenkel/translation-en-pt
收藏Hugging Face2022-08-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/VanessaSchenkel/translation-en-pt
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于翻译任务的双语数据集,包含英语和葡萄牙语的翻译数据。数据集的大小在10万到100万条之间,是通过翻译原始数据创建的。数据集的格式为DatasetDict,包含一个训练集,训练集的特征包括id和translation,其中translation字段包含英语和葡萄牙语的对应翻译。数据集的创建者和注释者信息为found,表明这些信息是从现有数据中提取的。
提供机构:
VanessaSchenkel
原始信息汇总
数据集概述
基本信息
- 数据集名称: VanessaSchenkel/translation-en-pt
- 语言: 英语(en)、葡萄牙语(pt)
- 许可证: AFL-3.0
- 多语言性: 翻译
数据集特征
- 大小: 100K<n<1M
- 来源: 原始数据
- 任务类别: 翻译
数据集结构
- 训练集:
-
特征: [id, translation]
-
行数: 260482
-
示例:
{id: 5, translation: {english: I have to go to sleep., portuguese: Tenho de dormir.}}
-



