five

Kencorpus/KenPOS

收藏
Hugging Face2025-10-28 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/Kencorpus/KenPOS
下载链接
链接失效反馈
官方服务:
资源简介:
KenPOS是一个面向肯尼亚语言的词性标注语料库,包括四种语言:Dholuo、Lubukusu、Lumarachi和Lulogooli,共有156,994个词汇。该数据集为低资源肯尼亚语言提供了人工标注的词性信息,支持自然语言处理的研究和应用。

KenPOS is a part-of-speech tagged corpus for Kenyan languages, including four languages: Dholuo, Lubukusu, Lumarachi, and Lulogooli, with a total of 156,994 tokens. The dataset provides manually annotated part-of-speech information for low-resource Kenyan languages, supporting research and applications in natural language processing.
提供机构:
Kencorpus
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作