irds/beir_webis-touche2020_v2

Name: irds/beir_webis-touche2020_v2
Creator: irds
Published: 2023-01-05 02:50:14
License: 暂无描述

Hugging Face2023-01-05 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/irds/beir_webis-touche2020_v2

下载链接

链接失效反馈

官方服务：

资源简介：

`beir/webis-touche2020/v2`数据集由ir-datasets包提供，包含382,545个文档、49个查询和2,214个相关性评估。该数据集适用于文本检索任务，用户可以通过HuggingFace的`datasets`库加载和使用这些数据。

The `beir/webis-touche2020/v2` dataset is distributed via the ir-datasets package, containing 382,545 documents, 49 queries, and 2,214 relevance judgments. This dataset is designed for text retrieval tasks, and users can load and utilize it through Hugging Face's `datasets` library.

提供机构：

irds

原始信息汇总

数据集概述

数据集名称

beir/webis-touche2020/v2

数据集来源

由ir-datasets包提供。

数据内容

文档 (`docs`)

数量：382,545
包含字段：doc_id, text, title, stance, url

查询 (`queries`)

数量：49
包含字段：query_id, text, description, narrative

数据集用途

用于文本检索任务。

引用信息

@inproceedings{Bondarenko2020Tuche, title={Overview of Touch{e} 2020: Argument Retrieval}, author={Alexander Bondarenko and Maik Fr{"o}be and Meriem Beloucif and Lukas Gienapp and Yamen Ajjour and Alexander Panchenko and Christian Biemann and Benno Stein and Henning Wachsmuth and Martin Potthast and Matthias Hagen}, booktitle={CLEF}, year={2020} } @article{Thakur2021Beir, title = "BEIR: A Heterogenous Benchmark for Zero-shot Evaluation of Information Retrieval Models", author = "Thakur, Nandan and Reimers, Nils and Rücklé, Andreas and Srivastava, Abhishek and Gurevych, Iryna", journal= "arXiv preprint arXiv:2104.08663", month = "4", year = "2021", url = "https://arxiv.org/abs/2104.08663", }

搜集汇总

数据集介绍

构建方式

在信息检索领域，构建高质量的数据集对于评估模型性能至关重要。beir/webis-touche2020/v2数据集源自Touché 2020论证检索任务，其构建过程严谨而系统。该数据集通过整合来自互联网的广泛文档资源，形成了一个包含382,545篇文档的语料库，每篇文档均附有标题、文本内容、立场及URL等元数据。同时，研究人员精心设计了49个查询主题，每个主题不仅包含查询文本，还提供了详细的描述和叙述，以明确检索意图。此外，通过专家标注生成了2,214条相关性评估数据，确保了数据集的可靠性与评估的准确性，为论证检索研究提供了坚实的实验基础。

特点

该数据集在论证检索领域展现出独特的特点，其文档规模庞大且内容多样，涵盖了广泛的论证性文本，有助于模型学习复杂的语义关系。查询设计细致入微，每个查询均配备描述和叙述部分，这增强了检索任务的挑战性，能够更全面地评估模型的理解能力。相关性评估数据经过严格标注，提供了多层次的反馈，支持精细的性能分析。数据集的结构化设计使其易于集成到现有检索框架中，同时其作为BEIR基准的一部分，促进了零样本评估的标准化，为跨领域信息检索研究提供了宝贵的资源。

使用方法

使用该数据集时，研究人员可通过Hugging Face的datasets库便捷地加载不同组件。具体而言，调用load_dataset函数并指定数据集名称及组件类型（如docs、queries或qrels），即可访问文档、查询或相关性评估数据。文档组件返回包含文档ID、文本、标题、立场和URL的字典；查询组件提供查询ID、文本、描述和叙述；相关性评估则包括查询ID、文档ID、相关性分数及迭代信息。这种模块化设计允许灵活的数据处理，支持信息检索模型的训练、验证与测试，同时确保数据格式的一致性和可重复性，助力高效的研究实验。

背景与挑战

背景概述

在信息检索领域，论证检索作为一项新兴任务，旨在从大规模文本中识别并提取具有说服力的论据，以支持或反驳特定主张。beir/webis-touche2020/v2数据集由Webis研究团队于2020年构建，作为Touché评测任务的核心资源，专注于论证检索的零样本评估。该数据集包含超过38万份文档和49个查询，由国际研究团队通过CLEF会议发布，显著推动了论证检索模型的发展，并为信息检索系统的性能评估提供了标准化基准。

当前挑战

论证检索任务面临多重挑战：首先，文档中论据的识别与抽取需要深入理解文本的语义结构和逻辑关系，这对模型的推理能力提出了较高要求；其次，数据集中查询数量有限且主题多样，增加了模型泛化与零样本学习的难度。在构建过程中，研究人员需处理大规模异构文本的标注一致性，确保相关性评估的准确性与可靠性，同时平衡文档的覆盖范围与质量，以反映真实世界论证场景的复杂性。

常用场景

经典使用场景

在信息检索领域，beir/webis-touche2020/v2数据集为论证检索任务提供了标准化的评估基准。该数据集包含超过38万份文档和49个查询，每个查询均配备详细的描述和叙事，旨在模拟真实世界中复杂论证场景的检索需求。研究者通常利用该数据集训练和测试检索模型，评估模型在识别相关论证文档方面的性能，特别是在零样本或小样本学习环境下，其结构化的查询-文档对和相关性标注为模型优化提供了精确的反馈机制。

解决学术问题

该数据集有效解决了论证检索中缺乏大规模、高质量基准数据的学术难题。通过整合多样化的文档来源和精细的相关性评估，它支持对检索模型泛化能力的系统性检验，促进了跨领域信息检索方法的发展。其意义在于推动了检索技术从传统关键词匹配向语义理解与论证推理的演进，为自然语言处理和信息检索的交叉研究提供了关键数据支撑，加速了智能检索系统在复杂任务中的实际应用。

衍生相关工作

围绕该数据集，学术界衍生出多项经典研究工作，如BEIR基准框架的提出，该框架将beir/webis-touche2020/v2纳入异构检索评估体系，推动了零样本检索模型的标准化比较。同时，Touché系列评测任务持续利用该数据集探索论证检索的新方法，促进了神经检索模型与语义匹配技术的创新。这些工作不仅深化了论证检索的理论基础，还为后续多模态检索和可解释性研究提供了重要启示。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

irds/beir_webis-touche2020_v2

数据集概述

数据集名称

数据集来源

数据内容

文档 (docs)

查询 (queries)

相关性评估 (qrels)

数据集用途

引用信息

文档 (`docs`)

查询 (`queries`)

相关性评估 (`qrels`)