adamo1139/HPLT3_pol_Latn
收藏Hugging Face2025-11-20 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/adamo1139/HPLT3_pol_Latn
下载链接
链接失效反馈官方服务:
资源简介:
HPLT3 dataset, Polish split. Should be a lot of tokens, probably 200B+ depending on tokenizer used.
not sure what license it has, I am not a lawyer. Find more dataset and license info here: https://hplt-project.org/datasets/v3.0
HPLT3数据集(HPLT3 dataset)的波兰语拆分版本。该数据集包含海量Token(Token),具体规模可达2000亿以上,具体数值取决于所使用的分词器(tokenizer)。
暂不清楚该数据集的授权协议,本人并非法律专业人士。如需获取更多关于该数据集及授权协议的详细信息,请访问:https://hplt-project.org/datasets/v3.0
提供机构:
adamo1139



