ecoue/nordmann2023
收藏Hugging Face2023-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ecoue/nordmann2023
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个多语言翻译数据集,主要涉及德语和英语之间的翻译任务。数据集包含了多个来源的数据,如Europarl、NewsCommentary、WikiTitles等。数据集的大小在1M到10M之间,分为训练集、验证集和测试集。数据集的特性是包含翻译对,支持德语和英语之间的翻译。
提供机构:
ecoue
原始信息汇总
数据集概述
基本信息
- 名称: nordmann2023
- 语言: 德语(de)、英语(en)
- 许可证: 未知
- 多语言性: 翻译
- 大小: 1M<n<10M
任务与标签
- 任务类别: 翻译
- 标签:
- europarl
- newscommentary
- wikititles
- ecb
- rapid
- eesc
- ema
- europat
- books
- ted2020
- qed
- eubookshop
数据集结构
- 配置名称: balanced
- 分割详情:
- 训练集:
- 示例数量: 5656659
- 字节数: 1539472445
- 验证集:
- 示例数量: 2754
- 字节数: 706611
- 测试集:
- 示例数量: 1831
- 字节数: 411077
- 训练集:
数据集大小
- 下载大小: 4076594396字节
- 数据集总大小: 1540590133字节



