MedMentions
收藏魔搭社区2025-10-14 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/MedMentions
下载链接
链接失效反馈官方服务:
资源简介:
displayName: MedMentions
labelTypes:
- English Corpus
license:
- CC0 1.0
mediaTypes:
- Medical
paperUrl: https://arxiv.org/pdf/1902.09476v1.pdf
publishDate: "2019"
publishUrl: https://github.com/chanzuckerberg/MedMentions
publisher:
- National Institutes of Health, USA
tags:
- Medical paper
taskTypes:
- Named Entity Recognition Ner
- Entity Linking
- Entity Extraction
---
# 数据集介绍
## 简介
MedMentions 是一种新的人工注释资源,用于识别生物医学概念。 MedMentions 与其他带注释的生物医学语料库的区别在于它的规模(超过 4,000 个摘要和超过 350,000 个链接提及),以及概念本体的规模(来自 UMLS 2017 的超过 300 万个概念)及其对生物医学学科的广泛覆盖。
## 类定义
null
## 引文
```
@article{mohan2019medmentions,
title={Medmentions: A large biomedical corpus annotated with umls concepts},
author={Mohan, Sunil and Li, Donghui},
journal={arXiv preprint arXiv:1902.09476},
year={2019}
}
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:MedMentions
标签类型:英文语料库
许可协议:CC0 1.0协议
媒体类型:医学
论文链接:https://arxiv.org/pdf/1902.09476v1.pdf
发布日期:2019年
发布链接:https://github.com/chanzuckerberg/MedMentions
发布方:美国国立卫生研究院(National Institutes of Health, USA)
标签:医学论文
任务类型:命名实体识别(Named Entity Recognition, NER)、实体链接(Entity Linking)、实体抽取(Entity Extraction)
---
# 数据集介绍
## 简介
MedMentions 是一款新型人工标注资源,用于生物医学概念识别。相较于其他已标注生物医学语料库,该数据集的核心优势在于其规模优势:包含超4000篇医学摘要、超350000个已链接提及实体,配套的概念本体规模同样庞大(涵盖来自统一医学语言系统(Unified Medical Language System,UMLS)2017版的超300万个生物医学概念),且覆盖了广泛的生物医学学科领域。
## 类定义
无
## 引文
@article{mohan2019medmentions,
title={MedMentions: A large biomedical corpus annotated with UMLS concepts},
author={Mohan, Sunil and Li, Donghui},
journal={arXiv preprint arXiv:1902.09476},
year={2019}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01



