five

lingvanex/lingvanex_test_references

收藏
Hugging Face2023-10-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lingvanex/lingvanex_test_references
下载链接
链接失效反馈
官方服务:
资源简介:
LTR数据集是一个用于机器翻译评估的测试参考数据集,支持从英语翻译到30种目标语言。数据集包含多种测试案例,涵盖了不同长度的句子、多个领域(如医学、汽车、金融)、标记、大小写、多语言文本、样式、错误、缩写、命名实体、习语、公式、罗马数字和Unicode特殊字符。数据集的规模在1K到10K之间,更新日期为2023年11月18日,采用CC BY-SA 4.0许可证发布。

LTR数据集是一个用于机器翻译评估的测试参考数据集,支持从英语翻译到30种目标语言。数据集包含多种测试案例,涵盖了不同长度的句子、多个领域(如医学、汽车、金融)、标记、大小写、多语言文本、样式、错误、缩写、命名实体、习语、公式、罗马数字和Unicode特殊字符。数据集的规模在1K到10K之间,更新日期为2023年11月18日,采用CC BY-SA 4.0许可证发布。
提供机构:
lingvanex
原始信息汇总

数据集概述

数据集任务

  • 任务类别: 翻译
  • 多语言性: 翻译

语言支持

  • 数据集支持以下语言:
    • 非洲语 (af)
    • 阿拉伯语 (ar)
    • 白俄罗斯语 (be)
    • 巴西葡萄牙语 (bp)
    • 波斯尼亚语 (bs)
    • 捷克语 (cs)
    • 丹麦语 (da)
    • 德语 (de)
    • 希腊语 (el)
    • 西班牙语 (es)
    • 爱沙尼亚语 (et)
    • 波斯语 (fa)
    • 芬兰语 (fi)
    • 法语 (fr)
    • 希伯来语 (he)
    • 匈牙利语 (hu)
    • 印度尼西亚语 (id)
    • 意大利语 (it)
    • 立陶宛语 (lt)
    • 拉脱维亚语 (lv)
    • 挪威语 (no)
    • 波兰语 (pl)
    • 葡萄牙语 (pt)
    • 罗马尼亚语 (ro)
    • 俄语 (ru)
    • 阿尔巴尼亚语 (sq)
    • 塞尔维亚语 (sr)
    • 瑞典语 (sv)
    • 土耳其语 (tr)
    • 乌克兰语 (uk)

数据集大小

  • 数据集大小类别: 1K<n<10K

配置详情

  • 配置名称: en-cs
    • 数据文件:
      • 分割: test
      • 路径: data/en-cs.csv
  • 配置名称: en-et
    • 数据文件:
      • 分割: test
      • 路径: data/en-et.csv
  • 配置名称: en-hu
    • 数据文件:
      • 分割: test
      • 路径: data/en-hu.csv
  • 配置名称: en-no
    • 数据文件:
      • 分割: test
      • 路径: data/en-no.csv
  • 配置名称: en-ru
    • 数据文件:
      • 分割: test
      • 路径: data/en-ru.csv
  • 配置名称: en-uk
    • 数据文件:
      • 分割: test
      • 路径: data/en-uk.csv
  • 配置名称: en-af
    • 数据文件:
      • 分割: test
      • 路径: data/en-af.csv
  • 配置名称: en-da
    • 数据文件:
      • 分割: test
      • 路径: data/en-da.csv
  • 配置名称: en-fa
    • 数据文件:
      • 分割: test
      • 路径: data/en-fa.csv
  • 配置名称: en-id
    • 数据文件:
      • 分割: test
      • 路径: data/en-id.csv
  • 配置名称: en-pl
    • 数据文件:
      • 分割: test
      • 路径: data/en-pl.csv
  • 配置名称: en-sq
    • 数据文件:
      • 分割: test
      • 路径: data/en-sq.csv
  • 配置名称: en-ar
    • 数据文件:
      • 分割: test
      • 路径: data/en-ar.csv
  • 配置名称: en-de
    • 数据文件:
      • 分割: test
      • 路径: data/en-de.csv
  • 配置名称: en-fi
    • 数据文件:
      • 分割: test
      • 路径: data/en-fi.csv
  • 配置名称: en-it
    • 数据文件:
      • 分割: test
      • 路径: data/en-it.csv
  • 配置名称: en-pt_br
    • 数据文件:
      • 分割: test
      • 路径: data/en-pt_br.csv
  • 配置名称: en-sr
    • 数据文件:
      • 分割: test
      • 路径: data/en-sr.csv
  • 配置名称: en-be
    • 数据文件:
      • 分割: test
      • 路径: data/en-be.csv
  • 配置名称: en-el
    • 数据文件:
      • 分割: test
      • 路径: data/en-el.csv
  • 配置名称: en-fr
    • 数据文件:
      • 分割: test
      • 路径: data/en-fr.csv
  • 配置名称: en-lt
    • 数据文件:
      • 分割: test
      • 路径: data/en-lt.csv
  • 配置名称: en-pt
    • 数据文件:
      • 分割: test
      • 路径: data/en-pt.csv
  • 配置名称: en-sv
    • 数据文件:
      • 分割: test
      • 路径: data/en-sv.csv
  • 配置名称: en-bs
    • 数据文件:
      • 分割: test
      • 路径: data/en-bs.csv
  • 配置名称: en-es
    • 数据文件:
      • 分割: test
      • 路径: data/en-es.csv
  • 配置名称: en-he
    • 数据文件:
      • 分割: test
      • 路径: data/en-he.csv
  • 配置名称: en-lv
    • 数据文件:
      • 分割: test
      • 路径: data/en-lv.csv
  • 配置名称: en-ro
    • 数据文件:
      • 分割: test
      • 路径: data/en-ro.csv
  • 配置名称: en-tr
    • 数据文件:
      • 分割: test
      • 路径: data/en-tr.csv
  • 配置名称: en-uk
    • 数据文件:
      • 分割: test
      • 路径: data/en-uk.csv

许可证

  • 许可证: CC BY-NC-SA 4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作