mteb/nfcorpus
收藏Hugging Face2025-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mteb/nfcorpus
下载链接
链接失效反馈官方服务:
资源简介:
NFCorpus是一个用于医疗信息检索的全文本学习排名数据集,包含训练、开发和测试数据集,以及语料库和查询信息。该数据集适用于医疗和学术领域。
NFCorpus is a full-text learning to rank dataset for medical information retrieval, containing training, development, and test datasets, as well as corpus and query information. It is suitable for the medical and academic fields.
提供机构:
mteb
原始信息汇总
数据集概述
语言和多语言性
- 语言: 英语
- 多语言性: 单语种
任务类别和ID
- 任务类别: 文本检索
- 任务ID: 文档检索
源数据集
- 源数据集: nfcorpus
配置名称
- 配置名称: corpus
标签
- 标签: 文本检索
数据集信息
配置名称: default
- 特征:
- 名称: query-id dtype: string
- 名称: corpus-id dtype: string
- 名称: score dtype: float64
- 分割:
- 名称: train num_bytes: 3720942 num_examples: 110575
- 名称: dev num_bytes: 383427 num_examples: 11385
- 名称: test num_bytes: 415220 num_examples: 12334
配置名称: corpus
- 特征:
- 名称: _id dtype: string
- 名称: title dtype: string
- 名称: text dtype: string
- 分割:
- 名称: corpus num_bytes: 5856698 num_examples: 3633
配置名称: queries
- 特征:
- 名称: _id dtype: string
- 名称: text dtype: string
- 分割:
- 名称: queries num_bytes: 128355 num_examples: 3237
配置
配置名称: default
- 数据文件:
- 分割: train 路径: qrels/train.jsonl
- 分割: dev 路径: qrels/dev.jsonl
- 分割: test 路径: qrels/test.jsonl
配置名称: corpus
- 数据文件:
- 分割: corpus 路径: corpus.jsonl
配置名称: queries
- 数据文件:
- 分割: queries 路径: queries.jsonl



