five

vgaraujov/fapesp

收藏
Hugging Face2024-03-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vgaraujov/fapesp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含英语到葡萄牙语和西班牙语到葡萄牙语的翻译任务数据,支持的语言有英语、西班牙语和葡萄牙语。数据集分为训练、验证和测试集,每个配置都详细列出了相应集的大小和示例数量。数据集遵循cc-by-2.0许可证。

该数据集包含英语到葡萄牙语和西班牙语到葡萄牙语的翻译任务数据,支持的语言有英语、西班牙语和葡萄牙语。数据集分为训练、验证和测试集,每个配置都详细列出了相应集的大小和示例数量。数据集遵循cc-by-2.0许可证。
提供机构:
vgaraujov
原始信息汇总

数据集概述

数据集配置

  • en-pt 配置

    • 语言对:英语(en)至葡萄牙语(pt)
    • 训练集:160975个例子,总大小47417503字节
    • 验证集:1375个例子,总大小405055字节
    • 测试集:1447个例子,总大小407579字节
    • 下载大小:29615550字节
    • 数据集总大小:48230137字节
  • es-pt 配置

    • 语言对:西班牙语(es)至葡萄牙语(pt)
    • 训练集:158197个例子,总大小47480897字节
    • 验证集:1302个例子,总大小377101字节
    • 测试集:1379个例子,总大小400915字节
    • 下载大小:29829573字节
    • 数据集总大小:48258913字节

数据集特征

  • 翻译特征
    • en-pt:支持英语至葡萄牙语的翻译
    • es-pt:支持西班牙语至葡萄牙语的翻译

数据集文件

  • en-pt 配置

    • 训练集:路径为en-pt/train-*
    • 验证集:路径为en-pt/validation-*
    • 测试集:路径为en-pt/test-*
  • es-pt 配置

    • 训练集:路径为es-pt/train-*
    • 验证集:路径为es-pt/validation-*
    • 测试集:路径为es-pt/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作