five

PTPARL Corpus

收藏
SSH Open MarketPlace2025-07-04 更新2025-07-05 收录
下载链接:
https://marketplace.sshopencloud.eu/dataset/QJX017
下载链接
链接失效反馈
官方服务:
资源简介:
The corpus contains Portuguese parliamentary debates from 1970 to 2008. It is annotated with [LX-Tokenizer](http://lxcenter.di.fc.ul.pt/tools/en/LXTokenizerEN.html), [LX-Tagger](http://lxcenter.di.fc.ul.pt/tools/en/conteudo/LXTagger.html), MBT, [MBLEM](https://ilk.uvt.nl/mbma/) (lemmatisation). The corpus is available for download from the CLARIN PORTUGAL repository.

该语料库收录了1970年至2008年间的葡萄牙议会辩论文本。其已通过[LX分词器(LX-Tokenizer)](http://lxcenter.di.fc.ul.pt/tools/en/LXTokenizerEN.html)、[LX词性标注器(LX-Tagger)](http://lxcenter.di.fc.ul.pt/tools/en/conteudo/LXTagger.html)、MBT以及[MBLEM(词形还原工具)](https://ilk.uvt.nl/mbma/)完成标注。 该语料库可从CLARIN PORTUGAL存储库下载获取。
创建时间:
2025-07-04
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作