conll2003
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/conll2003
下载链接
链接失效反馈官方服务:
资源简介:
CoNLL-2003专注于语言独立的命名实体识别,数据规模为1万到10万条样本。它主要包含英文新闻文本,并标注了词性标签、句法块标签和命名实体标签,采用IOB2标注方案。该数据集主要来源于路透社语料库,经过众包方式进行标注,可用于命名实体识别和词性标注等任务。使用者需要注意路透社语料库的使用授权许可。
创建时间:
2024-07-19



