vgaraujov/fapesp
收藏Hugging Face2024-03-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vgaraujov/fapesp
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含英语到葡萄牙语和西班牙语到葡萄牙语的翻译任务数据,支持的语言有英语、西班牙语和葡萄牙语。数据集分为训练、验证和测试集,每个配置都详细列出了相应集的大小和示例数量。数据集遵循cc-by-2.0许可证。
该数据集包含英语到葡萄牙语和西班牙语到葡萄牙语的翻译任务数据,支持的语言有英语、西班牙语和葡萄牙语。数据集分为训练、验证和测试集,每个配置都详细列出了相应集的大小和示例数量。数据集遵循cc-by-2.0许可证。
提供机构:
vgaraujov
原始信息汇总
数据集概述
数据集配置
-
en-pt 配置
- 语言对:英语(en)至葡萄牙语(pt)
- 训练集:160975个例子,总大小47417503字节
- 验证集:1375个例子,总大小405055字节
- 测试集:1447个例子,总大小407579字节
- 下载大小:29615550字节
- 数据集总大小:48230137字节
-
es-pt 配置
- 语言对:西班牙语(es)至葡萄牙语(pt)
- 训练集:158197个例子,总大小47480897字节
- 验证集:1302个例子,总大小377101字节
- 测试集:1379个例子,总大小400915字节
- 下载大小:29829573字节
- 数据集总大小:48258913字节
数据集特征
- 翻译特征:
- en-pt:支持英语至葡萄牙语的翻译
- es-pt:支持西班牙语至葡萄牙语的翻译
数据集文件
-
en-pt 配置:
- 训练集:路径为
en-pt/train-* - 验证集:路径为
en-pt/validation-* - 测试集:路径为
en-pt/test-*
- 训练集:路径为
-
es-pt 配置:
- 训练集:路径为
es-pt/train-* - 验证集:路径为
es-pt/validation-* - 测试集:路径为
es-pt/test-*
- 训练集:路径为



