five

Universal Treebank

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/ryanmcd/uni-dep-tb
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含12个标签的多语言词性标注数据集,覆盖了10种不同的语言。该数据集在处理过程中未使用任何外部资源,且报告的结果是基于mBERT上下文表示的。其所涉及的任务是词性标注。

This dataset is a multilingual part-of-speech tagging dataset with 12 tags, covering 10 distinct languages. No external resources were utilized during its processing, and the reported results are based on the contextual representations of mBERT. The task involved in this dataset is part-of-speech tagging.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作