five

MedMentions

收藏
魔搭社区2025-10-14 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/MedMentions
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: MedMentions labelTypes: - English Corpus license: - CC0 1.0 mediaTypes: - Medical paperUrl: https://arxiv.org/pdf/1902.09476v1.pdf publishDate: "2019" publishUrl: https://github.com/chanzuckerberg/MedMentions publisher: - National Institutes of Health, USA tags: - Medical paper taskTypes: - Named Entity Recognition Ner - Entity Linking - Entity Extraction --- # 数据集介绍 ## 简介 MedMentions 是一种新的人工注释资源,用于识别生物医学概念。 MedMentions 与其他带注释的生物医学语料库的区别在于它的规模(超过 4,000 个摘要和超过 350,000 个链接提及),以及概念本体的规模(来自 UMLS 2017 的超过 300 万个概念)及其对生物医学学科的广泛覆盖。 ## 类定义 null ## 引文 ``` @article{mohan2019medmentions, title={Medmentions: A large biomedical corpus annotated with umls concepts}, author={Mohan, Sunil and Li, Donghui}, journal={arXiv preprint arXiv:1902.09476}, year={2019} } ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称:MedMentions 标签类型:英文语料库 许可协议:CC0 1.0协议 媒体类型:医学 论文链接:https://arxiv.org/pdf/1902.09476v1.pdf 发布日期:2019年 发布链接:https://github.com/chanzuckerberg/MedMentions 发布方:美国国立卫生研究院(National Institutes of Health, USA) 标签:医学论文 任务类型:命名实体识别(Named Entity Recognition, NER)、实体链接(Entity Linking)、实体抽取(Entity Extraction) --- # 数据集介绍 ## 简介 MedMentions 是一款新型人工标注资源,用于生物医学概念识别。相较于其他已标注生物医学语料库,该数据集的核心优势在于其规模优势:包含超4000篇医学摘要、超350000个已链接提及实体,配套的概念本体规模同样庞大(涵盖来自统一医学语言系统(Unified Medical Language System,UMLS)2017版的超300万个生物医学概念),且覆盖了广泛的生物医学学科领域。 ## 类定义 无 ## 引文 @article{mohan2019medmentions, title={MedMentions: A large biomedical corpus annotated with UMLS concepts}, author={Mohan, Sunil and Li, Donghui}, journal={arXiv preprint arXiv:1902.09476}, year={2019} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作