BC4CHEMD (BioCreative IV Chemical compound and drug name recognition)
收藏OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/BC4CHEMD
下载链接
链接失效反馈官方服务:
资源简介:
由 Krallinger 等人介绍。在 CHEMDNER 化学品和药物语料库及其注释原则中
BC4CHEMD 是 10,000 个 PubMed 摘要的集合,其中包含由专家化学文献策展人手动标记的总共 84,355 个化学实体提及。
Introduced by Krallinger et al. in the CHEMDNER Chemical and Drug Corpus and its annotation principles, BC4CHEMD is a collection of 10,000 PubMed abstracts containing a total of 84,355 chemical entity mentions manually labeled by expert chemical literature curators.
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
BC4CHEMD是一个用于化学化合物和药物名称识别的生物医学文本数据集,包含10,000个PubMed摘要,其中专家手动标注了84,355个化学实体提及。该数据集由西班牙国家癌症研究中心和纳瓦拉大学于2014年发布,适用于文本预训练、命名实体标注等自然语言处理任务,具有规模大、标注质量高的特点。
以上内容由遇见数据集搜集并总结生成



