BoolQ

github2024-05-15 更新2024-05-31 收录

下载链接：

https://github.com/google-research-datasets/boolean-questions

下载链接

链接失效反馈

官方服务：

资源简介：

BoolQ是一个包含15942个例子的问答数据集，用于回答是/否问题。这些问题是自然发生的，生成于无引导和无限制的环境中。每个例子是一个三元组（问题，段落，答案），页面的标题作为可选的额外上下文。文本对分类设置类似于现有的自然语言推理任务。通过从信息查询分布中抽样问题（而不是引导注释者生成文本对），我们观察到比现有NLI数据集更具有挑战性的例子。

BoolQ is a question-answering dataset comprising 15,942 examples designed for answering yes/no questions. These questions arise naturally and are generated in an unguided and unrestricted environment. Each example is a triplet (question, passage, answer), with the page title serving as optional additional context. The text pair classification setup is akin to existing natural language inference tasks. By sampling questions from an information-seeking distribution (rather than prompting annotators to generate text pairs), we observe more challenging examples compared to existing NLI datasets.

创建时间：

2019-05-29

原始信息汇总

BoolQ Dataset 概述

数据集基本信息

名称: BoolQ
类型: 问答数据集
规模: 包含15942个示例
特点: 自然发生的yes/no问题，生成于无提示和无约束的环境中

数据集结构

格式: 每个示例为三元组（问题，段落，答案），附加页面标题作为可选上下文
文件类型: .jsonl
文件内容格式: 每行是一个JSON字典，包含question, passage, answer, title字段

数据集文件

train.jsonl: 9427个标记的训练示例
dev.jsonl: 3270个标记的开发示例
test.jsonl: 3245个未标记的测试示例

数据集使用许可

许可类型: 创意共享署名-相同方式共享3.0许可

数据集链接

训练集: 链接
开发集: 链接

搜集汇总

数据集介绍

构建方式

BoolQ数据集的构建基于自然产生的是/否问题，这些问题在无引导和无限制的环境中生成，确保了问题的真实性和多样性。每个样本由一个问题、一段相关文本以及一个布尔答案组成，部分样本还包含页面标题作为额外上下文。通过从信息检索查询的分布中采样问题，BoolQ数据集相较于现有的自然语言推理数据集，展现了更为复杂和具有挑战性的实例。

特点

BoolQ数据集的核心特点在于其问题的自然性和复杂性。数据集包含15942个样本，每个样本均由自然生成的问题和相关文本组成，答案为简单的布尔值（是/否）。这种结构使得数据集在处理自然语言推理任务时，能够提供更具挑战性的训练和评估环境。此外，数据集的多样性和真实性使其在自然语言处理领域具有广泛的应用潜力。

使用方法

BoolQ数据集主要用于训练和评估自然语言推理模型，特别是处理是/否问题的模型。用户可以通过加载数据集的三个`.jsonl`文件（训练集、开发集和测试集）进行模型训练和验证。每个文件中的每一行都是一个JSON字典，包含问题、相关文本、答案和可选的标题。用户可以根据需要提取和处理这些数据，以适应不同的模型架构和任务需求。

背景与挑战

背景概述

BoolQ数据集是一个专注于是非问答任务的数据集，由Clark等人于2019年发布。该数据集包含15942个自然生成的问答对，每个问答对由问题、相关段落和答案组成，部分实例还提供了页面标题作为额外上下文。BoolQ的独特之处在于其问题是在无提示和无约束的环境中自然生成的，这使得其数据分布更接近真实的信息检索场景。通过从信息检索查询中采样问题，BoolQ显著提升了自然语言推理任务的难度，为研究者提供了一个更具挑战性的基准。该数据集的发布对自然语言处理领域，尤其是问答系统和自然语言推理任务的研究产生了深远影响。

当前挑战

BoolQ数据集的主要挑战在于其问题的自然生成特性，这使得问题与段落之间的关联性更加复杂，难以通过简单的规则或模式进行预测。此外，数据集中的答案为二元选择（是/否），这要求模型不仅能够理解文本的语义，还需具备较强的推理能力。在构建过程中，研究人员面临的挑战包括如何确保问题的多样性和代表性，以及如何有效地标注和验证答案的准确性。这些挑战使得BoolQ成为评估模型在复杂自然语言推理任务中表现的重要基准。

常用场景

经典使用场景

BoolQ数据集在自然语言推理任务中展现了其独特的价值，尤其适用于处理二元答案的问答系统。通过提供自然生成的问答对，该数据集能够帮助模型学习如何在复杂文本背景下进行推理，从而准确判断问题的肯定或否定答案。这种设置不仅模拟了真实世界中的信息检索场景，还为模型提供了更具挑战性的训练样本，使其在处理复杂问题时表现更为出色。

衍生相关工作

BoolQ数据集的发布激发了大量相关研究工作，尤其是在自然语言推理和问答系统领域。许多研究者基于BoolQ开发了新的模型和算法，以提升二元问答的准确性和效率。此外，BoolQ还启发了其他数据集的设计，推动了自然语言处理领域对复杂推理任务的关注。这些衍生工作不仅丰富了NLP的研究内容，还为实际应用提供了更多可能性。

数据集最近研究