five

BC5CDR

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/jhnlp/biocreative-v-cdr-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个生物医学命名实体识别的基准数据集,其中包含了疾病实体。此外,该数据集结合了从PubMed文章中生成的弱标签信息,用于命名实体识别任务。

This dataset is a benchmark dataset for biomedical named entity recognition (NER), which contains disease entities. Additionally, it incorporates weakly labeled information generated from PubMed articles for the NER task.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
BC5CDR数据集是一个生物医学文本挖掘资源,专注于从PubMed摘要中自动检测化学/药物和疾病及其关系,特别是药物诱导的疾病关系。数据集提供了两种格式(PubTator和BioC)的标注信息,适用于自然语言处理和生物信息学领域的研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作