BC5CDR
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/jhnlp/biocreative-v-cdr-corpus
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个生物医学命名实体识别的基准数据集,其中包含了疾病实体。此外,该数据集结合了从PubMed文章中生成的弱标签信息,用于命名实体识别任务。
This dataset is a benchmark dataset for biomedical named entity recognition (NER), which contains disease entities. Additionally, it incorporates weakly labeled information generated from PubMed articles for the NER task.
搜集汇总
数据集介绍

背景与挑战
背景概述
BC5CDR数据集是一个生物医学文本挖掘资源,专注于从PubMed摘要中自动检测化学/药物和疾病及其关系,特别是药物诱导的疾病关系。数据集提供了两种格式(PubTator和BioC)的标注信息,适用于自然语言处理和生物信息学领域的研究。
以上内容由遇见数据集搜集并总结生成



