NER4conllu (Named Entites from Ancora Corpus)
收藏NIAID Data Ecosystem2026-03-12 收录
下载链接:
https://zenodo.org/record/4529299
下载链接
链接失效反馈官方服务:
资源简介:
Named Entites from Ancora Corpus
Since multiwords (including Named Entites) in the original Ancora corpus are aggregated as a single lexical item using underscores (e.g. "Ajuntament_de_Barcelona") we splitted them to align with word-per-line .conllu format, and added conventional Begin-Inside-Outside (IOB) tags to mark and classify Named Entites.
Entitats nombrades del corpus Ancora
Com que moltes multiparaules del corpus Ancora original es presenten com una sola paraula amb guions baixos (per exemple, "Ajuntament_de_Barcelona"), les hem dividides de manera que es puguin alinear amb el format conllu d'una paraula per línia. Per marcar-les i classificar-les hem fet servir les etiquetes de la convenció Begin-Inside-Outside (IOB).
创建时间:
2021-08-02



