NFCorpus
收藏魔搭社区2024-11-05 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/NFCorpus
下载链接
链接失效反馈官方服务:
资源简介:
displayName: NFCorpus
labelTypes:
- Text
license:
- NFCorpus Custom
mediaTypes:
- Text
paperUrl: https://www.cl.uni-heidelberg.de/~riezler/publications/papers/ECIR2016.pdf
publishDate: "2016-02-19"
publishUrl: https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/
publisher:
- Heidelberg University
tags:
- Medical Text
taskTypes:
- Information Retrieval
---
# 数据集介绍
## 简介
NFCorpus 是用于医学信息检索的全文英文检索数据集。它总共包含 3,244 个自然语言查询(用非技术英语编写,从 NutritionFacts.org 网站收集),其中 169,756 个自动提取的相关性判断对 9,964 个医学文档(用复杂的术语繁重的语言编写),主要来自 PubMed。
## 引文
@inproceedings{boteva2016full,
title={A full-text learning to rank dataset for medical information retrieval},
author={Boteva, Vera and Gholipour, Demian and Sokolov, Artem and Riezler, Stefan},
booktitle={European Conference on Information Retrieval},
pages={716--722},
year={2016},
organization={Springer}
}
## Download dataset
:modelscope-code[]{type="git"}
显示名称:NFCorpus
标签类型:
- 文本
许可证:
- NFCorpus 自定义许可证
媒体类型:
- 文本
论文链接:https://www.cl.uni-heidelberg.de/~riezler/publications/papers/ECIR2016.pdf
发布日期:2016年2月19日
发布页面链接:https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/
发布机构:
- 海德堡大学
标签:
- 医学文本
任务类型:
- 信息检索
---
# 数据集简介
## 概述
NFCorpus 是面向医学信息检索的英文全文检索数据集。该数据集共包含3244条自然语言查询(采用非专业英语撰写,采集自NutritionFacts.org网站),同时涵盖169756条自动提取的相关性标注,关联9964篇医学文档。这些文档语言专业术语密集、表述复杂,主要采集自PubMed。
## 引文
@inproceedings{boteva2016full,
标题={面向医学信息检索的全文排序学习数据集},
作者={Boteva, Vera、Gholipour, Demian、Sokolov, Artem、Riezler, Stefan},
会议名称={欧洲信息检索大会},
页码={716--722},
年份={2016},
出版机构={Springer}
}
## 下载数据集
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02



