JNLPBA
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/JNLPBA
下载链接
链接失效反馈官方服务:
资源简介:
JNLPBA 是来自 GENIA 版本 3.02 语料库的生物医学数据集(Kim et al., 2003)。它是通过 MEDLINE 上的受控搜索创建的。根据基于化学分类的 48 类小分类,从这次搜索中选择了 2,000 份摘要并进行了手工注释。 36 个终端类用于注释 GENIA 语料库。
JNLPBA is a biomedical dataset sourced from the GENIA version 3.02 corpus (Kim et al., 2003). It was constructed via controlled searches on MEDLINE. From the results of this search, 2,000 abstracts were selected and manually annotated using 48 fine-grained categories from chemical classification. Thirty-six terminal categories were employed for annotating the GENIA corpus.
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
JNLPBA是一个生物医学领域的命名实体识别数据集,包含2000份来自GENIA 3.02语料库的手工注释摘要,主要用于医学命名实体识别任务。数据集由东京大学·国立情报学研究所在2004年发布。
以上内容由遇见数据集搜集并总结生成



