german-tokenizer-benchmark/ud-hdt
收藏Hugging Face2025-11-11 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/german-tokenizer-benchmark/ud-hdt
下载链接
链接失效反馈官方服务:
资源简介:
UD German-HDT数据集是一个德语的句子标记化版本的数据集,基于Universal Dependencies German-HDT。它包含了153,035个句子。
The UD German-HDT dataset is a tokenized sentence version of the Universal Dependencies German-HDT dataset, containing 153,035 sentences.
提供机构:
german-tokenizer-benchmark



