five

VanessaSchenkel/translation-en-pt

收藏
Hugging Face2022-08-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/VanessaSchenkel/translation-en-pt
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于翻译任务的双语数据集,包含英语和葡萄牙语的翻译数据。数据集的大小在10万到100万条之间,是通过翻译原始数据创建的。数据集的格式为DatasetDict,包含一个训练集,训练集的特征包括id和translation,其中translation字段包含英语和葡萄牙语的对应翻译。数据集的创建者和注释者信息为found,表明这些信息是从现有数据中提取的。
提供机构:
VanessaSchenkel
原始信息汇总

数据集概述

基本信息

  • 数据集名称: VanessaSchenkel/translation-en-pt
  • 语言: 英语(en)、葡萄牙语(pt)
  • 许可证: AFL-3.0
  • 多语言性: 翻译

数据集特征

  • 大小: 100K<n<1M
  • 来源: 原始数据
  • 任务类别: 翻译

数据集结构

  • 训练集:
    • 特征: [id, translation]

    • 行数: 260482

    • 示例:

      {id: 5, translation: {english: I have to go to sleep., portuguese: Tenho de dormir.}}

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作