TREC-DL-2020
收藏arXiv2025-09-30 收录
下载链接:
https://microsoft.github.io/msmarco/TREC-Deep-Learning-2020
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是在流行的TREC深度学习赛道第二年中使用,主要关注于段落检索。它提供了大量的查询以及用于训练和评估的庞大语料库。具体规模包括200个查询和880万的语料库,任务是对段落进行检索。
This dataset was employed in the second year of the widely adopted TREC Deep Learning Track, which centers on passage retrieval. It offers a substantial set of queries and a large-scale corpus for model training and evaluation. Specifically, it comprises 200 queries and a corpus of 8.8 million passages, with the core task being passage retrieval.
提供机构:
TREC
搜集汇总
数据集介绍

背景与挑战
背景概述
TREC-DL-2020是一个专注于大规模训练数据环境下信息检索研究的数据集,包含文档排名和段落排名两大任务,旨在评估深度学习等方法在大规模数据下的性能。数据集提供了丰富的训练和测试资源,包括MS-MARCO数据集和ORCAS点击数据,支持完整排名和重新排名两种子任务。
以上内容由遇见数据集搜集并总结生成



