five

Helsinki-NLP/opus_elhuyar

收藏
Hugging Face2024-02-14 更新2024-04-20 收录
下载链接:
https://hf-mirror.com/datasets/Helsinki-NLP/opus_elhuyar
下载链接
链接失效反馈
官方服务:
资源简介:
OpusElhuyar数据集由Elhuyar基金会提供,并由Joseba Garcia Beaumont提交到OPUS,主要用于西班牙语到巴斯克语的机器翻译任务。数据集的规模在100K到1M之间,包含642,348个训练样本,总大小为127,833,419字节。数据集的配置名为es-eu,特征为翻译任务,支持的语言为西班牙语和巴斯克语。
提供机构:
Helsinki-NLP
原始信息汇总

数据集概述

  • 名称: OpusElhuyar
  • 语言:
    • 西班牙语 (es)
    • 巴斯克语 (eu)
  • 许可: 未知
  • 多语言性: 翻译
  • 大小分类: 100K<n<1M
  • 源数据集: 原始
  • 任务类别: 翻译

数据集结构

  • 配置名称: es-eu
  • 特征:
    • 名称: translation
    • 数据类型:
      • 语言:
        • 西班牙语 (es)
        • 巴斯克语 (eu)
  • 分割:
    • 名称: train
    • 字节数: 127833419
    • 示例数: 642348
  • 下载大小: 74270872
  • 数据集大小: 127833419

数据集创建

  • 源数据: 原始
  • 任务: 机器翻译,从西班牙语到巴斯克语

引用信息

  • 作者: J. Tiedemann
  • 出版物: 在Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012)

贡献者

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作