bigbio/ncbi_disease
收藏Hugging Face2023-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigbio/ncbi_disease
下载链接
链接失效反馈官方服务:
资源简介:
NCBI疾病语料库是一个完全注释的语料库,用于生物医学自然语言处理社区的研究,特别是在疾病名称识别和概念规范化方面。
提供机构:
bigbio
原始信息汇总
数据集概述
基本信息
- 名称: NCBI Disease
- 语言: 英语
- 许可证: CC0-1.0
- 多语言性: 单语种
- PubMed可用性: 是
- 公开可用性: 是
任务类型
- 任务:
- 命名实体识别 (NER)
- 命名实体消歧 (NED)
描述
- 描述: NCBI疾病语料库全面标注了提及和概念级别,旨在作为生物医学自然语言处理社区的研究资源。
引用信息
@article{Dogan2014NCBIDC, title = {NCBI disease corpus: A resource for disease name recognition and concept normalization}, author = {Rezarta Islamaj Dogan and Robert Leaman and Zhiyong Lu}, year = 2014, journal = {Journal of biomedical informatics}, volume = 47, pages = {1--10} }
搜集汇总
数据集介绍

背景与挑战
背景概述
NCBI疾病语料库是一个用于生物医学自然语言处理的英文数据集,专注于疾病名称识别和概念标准化任务。该数据集由BigScience Biomedical项目维护,采用cc0-1.0许可证,文件大小为32.9 kB,基于2014年的学术研究构建,旨在为NER和NED任务提供资源支持。
以上内容由遇见数据集搜集并总结生成



