irds/medline_2004
收藏Hugging Face2023-01-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/irds/medline_2004
下载链接
链接失效反馈官方服务:
资源简介:
`medline/2004`数据集由`ir-datasets`包提供,主要用于文本检索任务。该数据集包含3,672,808个文档,这些文档是数据集的核心内容。数据集还被用于`medline_2004_trec-genomics-2004`和`medline_2004_trec-genomics-2005`两个相关数据集的构建。
提供机构:
irds
原始信息汇总
数据集概述
数据集名称
medline/2004
数据来源
- 由 ir-datasets 包提供。
数据内容
docs(文档,即语料库); 数量为3,672,808。
使用场景
数据加载示例
python from datasets import load_dataset
docs = load_dataset(irds/medline_2004, docs) for record in docs: record # {doc_id: ..., title: ..., abstract: ...}



