irds/antique

Name: irds/antique
Creator: irds
Published: 2023-01-05 02:43:08
License: 暂无描述

Hugging Face2023-01-05 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/irds/antique

下载链接

链接失效反馈

官方服务：

资源简介：

`antique`数据集由ir-datasets包提供，主要用于文本检索任务。该数据集包含403,666个文档（即语料库）。该数据集被多个子数据集使用，如`antique_test`、`antique_test_non-offensive`、`antique_train`等。

The `antique` dataset, provided by the ir-datasets package, is primarily used for text retrieval tasks. It contains 403,666 documents (i.e., the corpus). This dataset is utilized by multiple sub-datasets such as `antique_test`, `antique_test_non-offensive`, `antique_train`, and so on.

提供机构：

irds

原始信息汇总

数据集概述

数据集名称

antique

数据集来源

由ir-datasets包提供。

数据集内容

docs（文档，即语料库）；数量=403,666

数据集用途

用于以下子数据集：

antique_test
antique_test_non-offensive
antique_train
antique_train_split200-train
antique_train_split200-valid

数据集加载示例

python from datasets import load_dataset

docs = load_dataset(irds/antique, docs) for record in docs: record # {doc_id: ..., text: ...}

引用信息

@inproceedings{Hashemi2020Antique, title={ANTIQUE: A Non-Factoid Question Answering Benchmark}, author={Helia Hashemi and Mohammad Aliannejadi and Hamed Zamani and Bruce Croft}, booktitle={ECIR}, year={2020} }

搜集汇总

数据集介绍

构建方式

在信息检索领域，构建高质量的非事实性问答基准对于评估模型性能至关重要。ANTIQUE数据集通过从社区问答平台Yahoo! Answers中精心筛选出2,626个开放域非事实性问题，并针对每个问题收集了人工标注的相关文档集合，从而构建了一个包含403,666篇文档的语料库。该过程确保了数据来源的多样性和标注的可靠性，为研究社区提供了一个标准化的测试平台。

使用方法

研究人员可利用ANTIQUE数据集进行文本检索任务的模型训练与评估。通过Hugging Face的`datasets`库加载`irds/antique`数据集，用户可以便捷地访问文档语料，其中每条记录包含文档ID和文本内容。该数据集通常与衍生的训练和测试子集结合使用，以支持检索模型的开发、微调和性能比较，为信息检索领域的实验提供了标准化的数据接口。

背景与挑战

背景概述

在信息检索与自然语言处理领域，非事实性问答任务因其对复杂语义理解与上下文推理的高要求而备受关注。ANTIQUE数据集由Helia Hashemi、Mohammad Aliannejadi、Hamed Zamani和Bruce Croft等研究人员于2020年共同创建，旨在为社区提供一个专注于非事实性问题的问答基准。该数据集包含超过40万份文档，作为语料库支持相关研究，其核心研究问题聚焦于如何有效检索并理解开放域中需要解释、意见或建议的查询，而非简单的事实性答案。ANTIQUE的推出显著推动了对话式检索与深度语义匹配模型的发展，为评估系统在真实用户查询场景下的性能提供了重要资源。

当前挑战

ANTIQUE数据集所针对的非事实性问答任务面临多重挑战：非事实性问题通常涉及主观性、多义性和长文本依赖，要求模型超越表层关键词匹配，实现深层的语义关联与推理；同时，用户查询的多样性和模糊性增加了准确理解意图的难度。在数据集构建过程中，研究人员需克服大规模高质量语料收集与标注的困难，确保文档覆盖广泛领域且与真实用户问题相关，同时维护数据的一致性与无偏见性。此外，如何设计有效的评估指标以衡量系统在复杂问答场景下的性能，亦是该领域持续探索的关键问题。

常用场景

经典使用场景

在信息检索与问答系统领域，ANTIQUE数据集以其非事实性问答特性，成为评估检索模型性能的经典基准。该数据集包含超过40万份文档，广泛用于训练和测试检索系统在处理开放式、解释性查询时的能力。研究者常利用其构建端到端检索管道，模拟真实用户提出复杂问题并寻找相关答案的场景，从而推动检索算法在语义理解与上下文关联方面的进步。

解决学术问题

ANTIQUE数据集主要解决了非事实性问答中检索模型评估标准缺失的学术难题。传统检索基准多集中于事实性查询，而该数据集通过提供需要推理和解释的问答对，填补了复杂信息需求评估的空白。其意义在于促进了检索模型从关键词匹配向语义深度理解的范式转变，为学术界提供了衡量模型在真实场景下性能的统一尺度，对推动自然语言处理与信息检索的交叉研究产生了深远影响。

实际应用

在实际应用中，ANTIQUE数据集为智能客服系统、教育辅助工具以及专业知识库的检索模块提供了关键训练资源。例如，在在线教育平台中，系统可利用该数据集学习如何理解学生提出的开放式问题，并从海量学习材料中检索出解释性答案。企业知识管理系统同样可借鉴其构建机制，提升对员工复杂咨询的响应精度，实现更高效的信息流转与决策支持。

数据集最近研究