Helsinki-NLP/opus_elhuyar
收藏Hugging Face2024-02-14 更新2024-04-20 收录
下载链接:
https://hf-mirror.com/datasets/Helsinki-NLP/opus_elhuyar
下载链接
链接失效反馈官方服务:
资源简介:
OpusElhuyar数据集由Elhuyar基金会提供,并由Joseba Garcia Beaumont提交到OPUS,主要用于西班牙语到巴斯克语的机器翻译任务。数据集的规模在100K到1M之间,包含642,348个训练样本,总大小为127,833,419字节。数据集的配置名为es-eu,特征为翻译任务,支持的语言为西班牙语和巴斯克语。
提供机构:
Helsinki-NLP
原始信息汇总
数据集概述
- 名称: OpusElhuyar
- 语言:
- 西班牙语 (es)
- 巴斯克语 (eu)
- 许可: 未知
- 多语言性: 翻译
- 大小分类: 100K<n<1M
- 源数据集: 原始
- 任务类别: 翻译
数据集结构
- 配置名称: es-eu
- 特征:
- 名称: translation
- 数据类型:
- 语言:
- 西班牙语 (es)
- 巴斯克语 (eu)
- 语言:
- 分割:
- 名称: train
- 字节数: 127833419
- 示例数: 642348
- 下载大小: 74270872
- 数据集大小: 127833419
数据集创建
- 源数据: 原始
- 任务: 机器翻译,从西班牙语到巴斯克语
引用信息
- 作者: J. Tiedemann
- 出版物: 在Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012)
贡献者
- 添加者: @spatil6



