lingvanex/lingvanex_test_references
收藏Hugging Face2023-10-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lingvanex/lingvanex_test_references
下载链接
链接失效反馈官方服务:
资源简介:
LTR数据集是一个用于机器翻译评估的测试参考数据集,支持从英语翻译到30种目标语言。数据集包含多种测试案例,涵盖了不同长度的句子、多个领域(如医学、汽车、金融)、标记、大小写、多语言文本、样式、错误、缩写、命名实体、习语、公式、罗马数字和Unicode特殊字符。数据集的规模在1K到10K之间,更新日期为2023年11月18日,采用CC BY-SA 4.0许可证发布。
LTR数据集是一个用于机器翻译评估的测试参考数据集,支持从英语翻译到30种目标语言。数据集包含多种测试案例,涵盖了不同长度的句子、多个领域(如医学、汽车、金融)、标记、大小写、多语言文本、样式、错误、缩写、命名实体、习语、公式、罗马数字和Unicode特殊字符。数据集的规模在1K到10K之间,更新日期为2023年11月18日,采用CC BY-SA 4.0许可证发布。
提供机构:
lingvanex
原始信息汇总
数据集概述
数据集任务
- 任务类别: 翻译
- 多语言性: 翻译
语言支持
- 数据集支持以下语言:
- 非洲语 (af)
- 阿拉伯语 (ar)
- 白俄罗斯语 (be)
- 巴西葡萄牙语 (bp)
- 波斯尼亚语 (bs)
- 捷克语 (cs)
- 丹麦语 (da)
- 德语 (de)
- 希腊语 (el)
- 西班牙语 (es)
- 爱沙尼亚语 (et)
- 波斯语 (fa)
- 芬兰语 (fi)
- 法语 (fr)
- 希伯来语 (he)
- 匈牙利语 (hu)
- 印度尼西亚语 (id)
- 意大利语 (it)
- 立陶宛语 (lt)
- 拉脱维亚语 (lv)
- 挪威语 (no)
- 波兰语 (pl)
- 葡萄牙语 (pt)
- 罗马尼亚语 (ro)
- 俄语 (ru)
- 阿尔巴尼亚语 (sq)
- 塞尔维亚语 (sr)
- 瑞典语 (sv)
- 土耳其语 (tr)
- 乌克兰语 (uk)
数据集大小
- 数据集大小类别: 1K<n<10K
配置详情
- 配置名称: en-cs
- 数据文件:
- 分割: test
- 路径: data/en-cs.csv
- 数据文件:
- 配置名称: en-et
- 数据文件:
- 分割: test
- 路径: data/en-et.csv
- 数据文件:
- 配置名称: en-hu
- 数据文件:
- 分割: test
- 路径: data/en-hu.csv
- 数据文件:
- 配置名称: en-no
- 数据文件:
- 分割: test
- 路径: data/en-no.csv
- 数据文件:
- 配置名称: en-ru
- 数据文件:
- 分割: test
- 路径: data/en-ru.csv
- 数据文件:
- 配置名称: en-uk
- 数据文件:
- 分割: test
- 路径: data/en-uk.csv
- 数据文件:
- 配置名称: en-af
- 数据文件:
- 分割: test
- 路径: data/en-af.csv
- 数据文件:
- 配置名称: en-da
- 数据文件:
- 分割: test
- 路径: data/en-da.csv
- 数据文件:
- 配置名称: en-fa
- 数据文件:
- 分割: test
- 路径: data/en-fa.csv
- 数据文件:
- 配置名称: en-id
- 数据文件:
- 分割: test
- 路径: data/en-id.csv
- 数据文件:
- 配置名称: en-pl
- 数据文件:
- 分割: test
- 路径: data/en-pl.csv
- 数据文件:
- 配置名称: en-sq
- 数据文件:
- 分割: test
- 路径: data/en-sq.csv
- 数据文件:
- 配置名称: en-ar
- 数据文件:
- 分割: test
- 路径: data/en-ar.csv
- 数据文件:
- 配置名称: en-de
- 数据文件:
- 分割: test
- 路径: data/en-de.csv
- 数据文件:
- 配置名称: en-fi
- 数据文件:
- 分割: test
- 路径: data/en-fi.csv
- 数据文件:
- 配置名称: en-it
- 数据文件:
- 分割: test
- 路径: data/en-it.csv
- 数据文件:
- 配置名称: en-pt_br
- 数据文件:
- 分割: test
- 路径: data/en-pt_br.csv
- 数据文件:
- 配置名称: en-sr
- 数据文件:
- 分割: test
- 路径: data/en-sr.csv
- 数据文件:
- 配置名称: en-be
- 数据文件:
- 分割: test
- 路径: data/en-be.csv
- 数据文件:
- 配置名称: en-el
- 数据文件:
- 分割: test
- 路径: data/en-el.csv
- 数据文件:
- 配置名称: en-fr
- 数据文件:
- 分割: test
- 路径: data/en-fr.csv
- 数据文件:
- 配置名称: en-lt
- 数据文件:
- 分割: test
- 路径: data/en-lt.csv
- 数据文件:
- 配置名称: en-pt
- 数据文件:
- 分割: test
- 路径: data/en-pt.csv
- 数据文件:
- 配置名称: en-sv
- 数据文件:
- 分割: test
- 路径: data/en-sv.csv
- 数据文件:
- 配置名称: en-bs
- 数据文件:
- 分割: test
- 路径: data/en-bs.csv
- 数据文件:
- 配置名称: en-es
- 数据文件:
- 分割: test
- 路径: data/en-es.csv
- 数据文件:
- 配置名称: en-he
- 数据文件:
- 分割: test
- 路径: data/en-he.csv
- 数据文件:
- 配置名称: en-lv
- 数据文件:
- 分割: test
- 路径: data/en-lv.csv
- 数据文件:
- 配置名称: en-ro
- 数据文件:
- 分割: test
- 路径: data/en-ro.csv
- 数据文件:
- 配置名称: en-tr
- 数据文件:
- 分割: test
- 路径: data/en-tr.csv
- 数据文件:
- 配置名称: en-uk
- 数据文件:
- 分割: test
- 路径: data/en-uk.csv
- 数据文件:
许可证
- 许可证: CC BY-NC-SA 4.0



