Revised JNLPBA Corpus
收藏arXiv2019-01-29 更新2024-07-25 收录
下载链接:
https://iasl-btm.iis.sinica.edu.tw/BNER/Content/Revised_JNLPBA.zip
下载链接
链接失效反馈官方服务:
资源简介:
Revised JNLPBA Corpus是由信息科学研究所,中央研究院在台北创建的生物医学命名实体识别(BNER)和生物医学关系抽取(BRE)任务的数据集。该数据集保留了原始实体类型,包括蛋白质、DNA、RNA、细胞系和细胞类型,并通过领域专家根据新的标注指南重新手工整理了所有摘要。数据集创建过程中,指出了JNLPBA中的一些不完美问题并进行了修正。Revised JNLPBA Corpus主要应用于生物医学关系抽取任务,旨在提高NER系统在生物医学文本中的性能和准确性。
The Revised JNLPBA Corpus is a dataset for biomedical named entity recognition (BNER) and biomedical relation extraction (BRE) tasks, developed by the Institute of Information Science, Academia Sinica in Taipei. This dataset retains the original entity types including proteins, DNA, RNA, cell lines and cell types, and all abstracts have been manually reannotated by domain experts in accordance with new annotation guidelines. During the creation of this dataset, some imperfections in the original JNLPBA were identified and corrected. The Revised JNLPBA Corpus is primarily applied to biomedical relation extraction tasks, aiming to improve the performance and accuracy of named entity recognition systems in biomedical texts.
提供机构:
信息科学研究所,中央研究院,台北,台湾
创建时间:
2019-01-29
搜集汇总
数据集介绍

背景与挑战
背景概述
Revised JNLPBA Corpus是一个由信息科学研究所,中央研究院在台北创建的生物医学文本数据集,专注于命名实体识别和关系抽取任务。它保留了蛋白质、DNA、RNA、细胞系和细胞类型等原始实体类型,并通过领域专家重新手工整理摘要,修正了原始数据集的不完美问题,旨在提升生物医学文本中NER系统的性能和准确性。
以上内容由遇见数据集搜集并总结生成



