BEIR (Benchmarking IR)

Name: BEIR (Benchmarking IR)
Creator: OpenDataLab
Published: 2026-05-24 10:30:29
License: 暂无描述

OpenDataLab2026-05-24 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/BEIR

下载链接

链接失效反馈

官方服务：

资源简介：

BEIR（Benchmarking IR）是包含不同信息检索（IR）任务的异构基准。通过 BEIR，可以系统地研究多种神经检索方法的零样本泛化能力。该基准包含来自 17 个不同数据集的总共 9 个信息检索任务（事实检查、引文预测、重复问题检索、参数检索、新闻检索、问答、推文检索、生物医学 IR、实体检索）：MS MARCO TREC-COVID NFCorpus BioASQ 自然问题 HotpotQA FiQA-2018 Signal-1M TREC-新闻 ArguAna Touche 2020 CQADupStack Quora 问题对 DBPedia SciDocs FEVER Climate-FEVER SciFact

BEIR (Benchmarking IR) is a heterogeneous benchmark encompassing diverse information retrieval (IR) tasks. It enables systematic investigation of the zero-shot generalization capabilities of various neural retrieval methods. This benchmark comprises a total of 9 IR tasks drawn from 17 distinct datasets, including: fact checking, citation prediction, duplicate question retrieval, parameter retrieval, news retrieval, question answering, tweet retrieval, biomedical IR, and entity retrieval. The 17 datasets are as follows: MS MARCO, TREC-COVID, NFCorpus, BioASQ, Natural Questions, HotpotQA, FiQA-2018, Signal-1M, TREC-News, ArguAna, Touche 2020, CQADupStack, Quora Question Pairs, DBPedia, SciDocs, FEVER, Climate-FEVER, SciFact.

提供机构：

OpenDataLab

创建时间：

2022-08-19

搜集汇总

数据集介绍