five

TREC-DL-2020

收藏
arXiv2025-09-30 收录
下载链接:
https://microsoft.github.io/msmarco/TREC-Deep-Learning-2020
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是在流行的TREC深度学习赛道第二年中使用,主要关注于段落检索。它提供了大量的查询以及用于训练和评估的庞大语料库。具体规模包括200个查询和880万的语料库,任务是对段落进行检索。

This dataset was employed in the second year of the widely adopted TREC Deep Learning Track, which centers on passage retrieval. It offers a substantial set of queries and a large-scale corpus for model training and evaluation. Specifically, it comprises 200 queries and a corpus of 8.8 million passages, with the core task being passage retrieval.
提供机构:
TREC
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
TREC-DL-2020是一个专注于大规模训练数据环境下信息检索研究的数据集,包含文档排名和段落排名两大任务,旨在评估深度学习等方法在大规模数据下的性能。数据集提供了丰富的训练和测试资源,包括MS-MARCO数据集和ORCAS点击数据,支持完整排名和重新排名两种子任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作