UMCU/WikiDoc_Dutch_translated_with_MariaNMT
收藏Hugging Face2023-12-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/UMCU/WikiDoc_Dutch_translated_with_MariaNMT
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过Maria NMT模型将英文WikiDoc语料库翻译成荷兰语的结果。Maria NMT模型由Helsinki NLP训练,基于BART架构。数据集包含训练集,共有9696个样本,总大小为5594660字节。数据集的许可证为Creative Commons License。
提供机构:
UMCU
原始信息汇总
数据集卡片 "WikiDoc_Dutch_translated_with_MariaNMT"
配置
- 默认配置
- 数据文件
- 分割: 训练
- 路径: data/train-*
- 数据文件
数据集信息
- 特征
- 名称: instruction
- 数据类型: string
- 名称: input
- 数据类型: string
- 名称: output
- 数据类型: string
- 名称: instruction
- 分割
- 名称: 训练
- 字节数: 5594660
- 样本数: 9696
- 名称: 训练
- 下载大小: 3051082
- 数据集大小: 5594660
许可证
- 采用 WikiDoc 语料库的许可证: Creative Commons License (CC BY-SA 4.0)



