DGME/wmt25
收藏Hugging Face2025-11-20 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/DGME/wmt25
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
language:
- ar
- bg
- bn
- ca
- da
- de
- el
- es
- et
- fa
- fi
- fr
- gu
- he
- hi
- hr
- hu
- id
- is
- it
- ja
- kn
- ko
- lt
- lv
- ml
- mr
- nl
- 'no'
- pa
- pl
- pt
- ro
- ru
- sk
- sl
- sr
- sv
- sw
- ta
- te
- th
- tr
- uk
- ur
- vi
- zh
- zu
task_categories:
- translation
size_categories:
- 10K<n<100K
configs:
- config_name: cs-de_DE
data_files:
- split: train
path: cs-de_DE.jsonl
- config_name: cs-uk_UA
data_files:
- split: train
path: cs-uk_UA.jsonl
- config_name: en-ar_EG
data_files:
- split: train
path: en-ar_EG.jsonl
- config_name: en-bho_IN
data_files:
- split: train
path: en-bho_IN.jsonl
- config_name: en-bn_BD
data_files:
- split: train
path: en-bn_BD.jsonl
- config_name: en-cs_CZ
data_files:
- split: train
path: en-cs_CZ.jsonl
- config_name: en-de_DE
data_files:
- split: train
path: en-de_DE.jsonl
- config_name: en-el_GR
data_files:
- split: train
path: en-el_GR.jsonl
- config_name: en-et_EE
data_files:
- split: train
path: en-et_EE.jsonl
- config_name: en-fa_IR
data_files:
- split: train
path: en-fa_IR.jsonl
- config_name: en-hi_IN
data_files:
- split: train
path: en-hi_IN.jsonl
- config_name: en-id_ID
data_files:
- split: train
path: en-id_ID.jsonl
- config_name: en-is_IS
data_files:
- split: train
path: en-is_IS.jsonl
- config_name: en-it_IT
data_files:
- split: train
path: en-it_IT.jsonl
- config_name: en-ja_JP
data_files:
- split: train
path: en-ja_JP.jsonl
- config_name: en-kn_IN
data_files:
- split: train
path: en-kn_IN.jsonl
- config_name: en-ko_KR
data_files:
- split: train
path: en-ko_KR.jsonl
- config_name: en-lt_LT
data_files:
- split: train
path: en-lt_LT.jsonl
- config_name: en-mas_KE
data_files:
- split: train
path: en-mas_KE.jsonl
- config_name: en-mr_IN
data_files:
- split: train
path: en-mr_IN.jsonl
- config_name: en-ro_RO
data_files:
- split: train
path: en-ro_RO.jsonl
- config_name: en-ru_RU
data_files:
- split: train
path: en-ru_RU.jsonl
- config_name: en-sr_Cyrl_RS
data_files:
- split: train
path: en-sr_Cyrl_RS.jsonl
- config_name: en-sr_Latn_RS
data_files:
- split: train
path: en-sr_Latn_RS.jsonl
- config_name: en-sv_SE
data_files:
- split: train
path: en-sv_SE.jsonl
- config_name: en-th_TH
data_files:
- split: train
path: en-th_TH.jsonl
- config_name: en-tr_TR
data_files:
- split: train
path: en-tr_TR.jsonl
- config_name: en-uk_UA
data_files:
- split: train
path: en-uk_UA.jsonl
- config_name: en-vi_VN
data_files:
- split: train
path: en-vi_VN.jsonl
- config_name: en-zh_CN
data_files:
- split: train
path: en-zh_CN.jsonl
- config_name: ja-zh_CN
data_files:
- split: train
path: ja-zh_CN.jsonl
---
许可证:Apache 2.0许可证(Apache-2.0)
语言:
- 阿拉伯语(ar)
- 保加利亚语(bg)
- 孟加拉语(bn)
- 加泰罗尼亚语(ca)
- 丹麦语(da)
- 德语(de)
- 希腊语(el)
- 西班牙语(es)
- 爱沙尼亚语(et)
- 波斯语(fa)
- 芬兰语(fi)
- 法语(fr)
- 古吉拉特语(gu)
- 希伯来语(he)
- 印地语(hi)
- 克罗地亚语(hr)
- 匈牙利语(hu)
- 印尼语(id)
- 冰岛语(is)
- 意大利语(it)
- 日语(ja)
- 卡纳达语(kn)
- 韩语(ko)
- 立陶宛语(lt)
- 拉脱维亚语(lv)
- 马拉雅拉姆语(ml)
- 马拉地语(mr)
- 荷兰语(nl)
- 挪威语(no)
- 旁遮普语(pa)
- 波兰语(pl)
- 葡萄牙语(pt)
- 罗马尼亚语(ro)
- 俄语(ru)
- 斯洛伐克语(sk)
- 斯洛文尼亚语(sl)
- 塞尔维亚语(sr)
- 瑞典语(sv)
- 斯瓦希里语(sw)
- 泰米尔语(ta)
- 泰卢固语(te)
- 泰语(th)
- 土耳其语(tr)
- 乌克兰语(uk)
- 乌尔都语(ur)
- 越南语(vi)
- 中文(zh)
- 祖鲁语(zu)
任务类别:
- 翻译
规模类别:
- 10K<n<100K
配置项:
- 配置名称:cs-de_DE
数据文件:
- 拆分:训练集
路径:cs-de_DE.jsonl
- 配置名称:cs-uk_UA
数据文件:
- 拆分:训练集
路径:cs-uk_UA.jsonl
- 配置名称:en-ar_EG
数据文件:
- 拆分:训练集
路径:en-ar_EG.jsonl
- 配置名称:en-bho_IN
数据文件:
- 拆分:训练集
路径:en-bho_IN.jsonl
- 配置名称:en-bn_BD
数据文件:
- 拆分:训练集
路径:en-bn_BD.jsonl
- 配置名称:en-cs_CZ
数据文件:
- 拆分:训练集
路径:en-cs_CZ.jsonl
- 配置名称:en-de_DE
数据文件:
- 拆分:训练集
路径:en-de_DE.jsonl
- 配置名称:en-el_GR
数据文件:
- 拆分:训练集
路径:en-el_GR.jsonl
- 配置名称:en-et_EE
数据文件:
- 拆分:训练集
路径:en-et_EE.jsonl
- 配置名称:en-fa_IR
数据文件:
- 拆分:训练集
路径:en-fa_IR.jsonl
- 配置名称:en-hi_IN
数据文件:
- 拆分:训练集
路径:en-hi_IN.jsonl
- 配置名称:en-id_ID
数据文件:
- 拆分:训练集
路径:en-id_ID.jsonl
- 配置名称:en-is_IS
数据文件:
- 拆分:训练集
路径:en-is_IS.jsonl
- 配置名称:en-it_IT
数据文件:
- 拆分:训练集
路径:en-it_IT.jsonl
- 配置名称:en-ja_JP
数据文件:
- 拆分:训练集
路径:en-ja_JP.jsonl
- 配置名称:en-kn_IN
数据文件:
- 拆分:训练集
路径:en-kn_IN.jsonl
- 配置名称:en-ko_KR
数据文件:
- 拆分:训练集
路径:en-ko_KR.jsonl
- 配置名称:en-lt_LT
数据文件:
- 拆分:训练集
路径:en-lt_LT.jsonl
- 配置名称:en-mas_KE
数据文件:
- 拆分:训练集
路径:en-mas_KE.jsonl
- 配置名称:en-mr_IN
数据文件:
- 拆分:训练集
路径:en-mr_IN.jsonl
- 配置名称:en-ro_RO
数据文件:
- 拆分:训练集
路径:en-ro_RO.jsonl
- 配置名称:en-ru_RU
数据文件:
- 拆分:训练集
路径:en-ru_RU.jsonl
- 配置名称:en-sr_Cyrl_RS
数据文件:
- 拆分:训练集
路径:en-sr_Cyrl_RS.jsonl
- 配置名称:en-sr_Latn_RS
数据文件:
- 拆分:训练集
路径:en-sr_Latn_RS.jsonl
- 配置名称:en-sv_SE
数据文件:
- 拆分:训练集
路径:en-sv_SE.jsonl
- 配置名称:en-th_TH
数据文件:
- 拆分:训练集
路径:en-th_TH.jsonl
- 配置名称:en-tr_TR
数据文件:
- 拆分:训练集
路径:en-tr_TR.jsonl
- 配置名称:en-uk_UA
数据文件:
- 拆分:训练集
路径:en-uk_UA.jsonl
- 配置名称:en-vi_VN
数据文件:
- 拆分:训练集
路径:en-vi_VN.jsonl
- 配置名称:en-zh_CN
数据文件:
- 拆分:训练集
路径:en-zh_CN.jsonl
- 配置名称:ja-zh_CN
数据文件:
- 拆分:训练集
路径:ja-zh_CN.jsonl
提供机构:
DGME



