five

DGME/wmt25

收藏
Hugging Face2025-11-20 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/DGME/wmt25
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 language: - ar - bg - bn - ca - da - de - el - es - et - fa - fi - fr - gu - he - hi - hr - hu - id - is - it - ja - kn - ko - lt - lv - ml - mr - nl - 'no' - pa - pl - pt - ro - ru - sk - sl - sr - sv - sw - ta - te - th - tr - uk - ur - vi - zh - zu task_categories: - translation size_categories: - 10K<n<100K configs: - config_name: cs-de_DE data_files: - split: train path: cs-de_DE.jsonl - config_name: cs-uk_UA data_files: - split: train path: cs-uk_UA.jsonl - config_name: en-ar_EG data_files: - split: train path: en-ar_EG.jsonl - config_name: en-bho_IN data_files: - split: train path: en-bho_IN.jsonl - config_name: en-bn_BD data_files: - split: train path: en-bn_BD.jsonl - config_name: en-cs_CZ data_files: - split: train path: en-cs_CZ.jsonl - config_name: en-de_DE data_files: - split: train path: en-de_DE.jsonl - config_name: en-el_GR data_files: - split: train path: en-el_GR.jsonl - config_name: en-et_EE data_files: - split: train path: en-et_EE.jsonl - config_name: en-fa_IR data_files: - split: train path: en-fa_IR.jsonl - config_name: en-hi_IN data_files: - split: train path: en-hi_IN.jsonl - config_name: en-id_ID data_files: - split: train path: en-id_ID.jsonl - config_name: en-is_IS data_files: - split: train path: en-is_IS.jsonl - config_name: en-it_IT data_files: - split: train path: en-it_IT.jsonl - config_name: en-ja_JP data_files: - split: train path: en-ja_JP.jsonl - config_name: en-kn_IN data_files: - split: train path: en-kn_IN.jsonl - config_name: en-ko_KR data_files: - split: train path: en-ko_KR.jsonl - config_name: en-lt_LT data_files: - split: train path: en-lt_LT.jsonl - config_name: en-mas_KE data_files: - split: train path: en-mas_KE.jsonl - config_name: en-mr_IN data_files: - split: train path: en-mr_IN.jsonl - config_name: en-ro_RO data_files: - split: train path: en-ro_RO.jsonl - config_name: en-ru_RU data_files: - split: train path: en-ru_RU.jsonl - config_name: en-sr_Cyrl_RS data_files: - split: train path: en-sr_Cyrl_RS.jsonl - config_name: en-sr_Latn_RS data_files: - split: train path: en-sr_Latn_RS.jsonl - config_name: en-sv_SE data_files: - split: train path: en-sv_SE.jsonl - config_name: en-th_TH data_files: - split: train path: en-th_TH.jsonl - config_name: en-tr_TR data_files: - split: train path: en-tr_TR.jsonl - config_name: en-uk_UA data_files: - split: train path: en-uk_UA.jsonl - config_name: en-vi_VN data_files: - split: train path: en-vi_VN.jsonl - config_name: en-zh_CN data_files: - split: train path: en-zh_CN.jsonl - config_name: ja-zh_CN data_files: - split: train path: ja-zh_CN.jsonl ---

许可证:Apache 2.0许可证(Apache-2.0) 语言: - 阿拉伯语(ar) - 保加利亚语(bg) - 孟加拉语(bn) - 加泰罗尼亚语(ca) - 丹麦语(da) - 德语(de) - 希腊语(el) - 西班牙语(es) - 爱沙尼亚语(et) - 波斯语(fa) - 芬兰语(fi) - 法语(fr) - 古吉拉特语(gu) - 希伯来语(he) - 印地语(hi) - 克罗地亚语(hr) - 匈牙利语(hu) - 印尼语(id) - 冰岛语(is) - 意大利语(it) - 日语(ja) - 卡纳达语(kn) - 韩语(ko) - 立陶宛语(lt) - 拉脱维亚语(lv) - 马拉雅拉姆语(ml) - 马拉地语(mr) - 荷兰语(nl) - 挪威语(no) - 旁遮普语(pa) - 波兰语(pl) - 葡萄牙语(pt) - 罗马尼亚语(ro) - 俄语(ru) - 斯洛伐克语(sk) - 斯洛文尼亚语(sl) - 塞尔维亚语(sr) - 瑞典语(sv) - 斯瓦希里语(sw) - 泰米尔语(ta) - 泰卢固语(te) - 泰语(th) - 土耳其语(tr) - 乌克兰语(uk) - 乌尔都语(ur) - 越南语(vi) - 中文(zh) - 祖鲁语(zu) 任务类别: - 翻译 规模类别: - 10K<n<100K 配置项: - 配置名称:cs-de_DE 数据文件: - 拆分:训练集 路径:cs-de_DE.jsonl - 配置名称:cs-uk_UA 数据文件: - 拆分:训练集 路径:cs-uk_UA.jsonl - 配置名称:en-ar_EG 数据文件: - 拆分:训练集 路径:en-ar_EG.jsonl - 配置名称:en-bho_IN 数据文件: - 拆分:训练集 路径:en-bho_IN.jsonl - 配置名称:en-bn_BD 数据文件: - 拆分:训练集 路径:en-bn_BD.jsonl - 配置名称:en-cs_CZ 数据文件: - 拆分:训练集 路径:en-cs_CZ.jsonl - 配置名称:en-de_DE 数据文件: - 拆分:训练集 路径:en-de_DE.jsonl - 配置名称:en-el_GR 数据文件: - 拆分:训练集 路径:en-el_GR.jsonl - 配置名称:en-et_EE 数据文件: - 拆分:训练集 路径:en-et_EE.jsonl - 配置名称:en-fa_IR 数据文件: - 拆分:训练集 路径:en-fa_IR.jsonl - 配置名称:en-hi_IN 数据文件: - 拆分:训练集 路径:en-hi_IN.jsonl - 配置名称:en-id_ID 数据文件: - 拆分:训练集 路径:en-id_ID.jsonl - 配置名称:en-is_IS 数据文件: - 拆分:训练集 路径:en-is_IS.jsonl - 配置名称:en-it_IT 数据文件: - 拆分:训练集 路径:en-it_IT.jsonl - 配置名称:en-ja_JP 数据文件: - 拆分:训练集 路径:en-ja_JP.jsonl - 配置名称:en-kn_IN 数据文件: - 拆分:训练集 路径:en-kn_IN.jsonl - 配置名称:en-ko_KR 数据文件: - 拆分:训练集 路径:en-ko_KR.jsonl - 配置名称:en-lt_LT 数据文件: - 拆分:训练集 路径:en-lt_LT.jsonl - 配置名称:en-mas_KE 数据文件: - 拆分:训练集 路径:en-mas_KE.jsonl - 配置名称:en-mr_IN 数据文件: - 拆分:训练集 路径:en-mr_IN.jsonl - 配置名称:en-ro_RO 数据文件: - 拆分:训练集 路径:en-ro_RO.jsonl - 配置名称:en-ru_RU 数据文件: - 拆分:训练集 路径:en-ru_RU.jsonl - 配置名称:en-sr_Cyrl_RS 数据文件: - 拆分:训练集 路径:en-sr_Cyrl_RS.jsonl - 配置名称:en-sr_Latn_RS 数据文件: - 拆分:训练集 路径:en-sr_Latn_RS.jsonl - 配置名称:en-sv_SE 数据文件: - 拆分:训练集 路径:en-sv_SE.jsonl - 配置名称:en-th_TH 数据文件: - 拆分:训练集 路径:en-th_TH.jsonl - 配置名称:en-tr_TR 数据文件: - 拆分:训练集 路径:en-tr_TR.jsonl - 配置名称:en-uk_UA 数据文件: - 拆分:训练集 路径:en-uk_UA.jsonl - 配置名称:en-vi_VN 数据文件: - 拆分:训练集 路径:en-vi_VN.jsonl - 配置名称:en-zh_CN 数据文件: - 拆分:训练集 路径:en-zh_CN.jsonl - 配置名称:ja-zh_CN 数据文件: - 拆分:训练集 路径:ja-zh_CN.jsonl
提供机构:
DGME
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作