WenWW/KD_data
收藏Hugging Face2024-12-04 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/WenWW/KD_data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种语言的文本数据,每种语言都有相应的分块,包括英语(en)、德语(de)、法语(fr)、西班牙语(es)、意大利语(it)、波兰语(pl)、罗马尼亚语(ro)、荷兰语(nl)、希腊语(el)、匈牙利语(hu)、葡萄牙语(pt)、捷克语(cs)、瑞典语(sv)、保加利亚语(bg)、丹麦语(da)、芬兰语(fi)、斯洛伐克语(sk)、克罗地亚语(hr)、立陶宛语(lt)、斯洛文尼亚语(sl)、拉脱维亚语(lv)、爱沙尼亚语(et)、爱尔兰语(ga)和马耳他语(mt)。每个语言分块都有指定数量的字节和示例,表明数据集可能用于多语言文本处理或机器翻译任务。
This dataset contains text data in multiple languages, with each language having its corresponding split, including English (en), German (de), French (fr), Spanish (es), Italian (it), Polish (pl), Romanian (ro), Dutch (nl), Greek (el), Hungarian (hu), Portuguese (pt), Czech (cs), Swedish (sv), Bulgarian (bg), Danish (da), Finnish (fi), Slovak (sk), Croatian (hr), Lithuanian (lt), Slovenian (sl), Latvian (lv), Estonian (et), Irish (ga), and Maltese (mt). Each language split has a specified number of bytes and examples, suggesting that the dataset may be used for multilingual text processing or machine translation tasks.
提供机构:
WenWW



