ucinlp/drop

Name: ucinlp/drop
Creator: ucinlp
Published: 2024-01-17 08:15:43
License: 暂无描述

Hugging Face2024-01-17 更新2024-04-19 收录

下载链接：

https://hf-mirror.com/datasets/ucinlp/drop

下载链接

链接失效反馈

官方服务：

资源简介：

DROP是一个众包创建的、包含约96,000个问题的阅读理解基准数据集，要求系统在段落中进行引用解析并执行离散操作（如加法、计数或排序）。这些操作需要对段落内容有更全面的理解，超越了之前数据集的要求。数据集包含段落、问题和答案跨度等字段，分为训练集和验证集，分别包含77,400和9,535个示例。

DROP is a crowdsourced reading comprehension benchmark dataset encompassing approximately 96,000 questions. It requires systems to conduct coreference resolution on paragraphs and carry out discrete operations such as addition, counting, or sorting. These operations require a more comprehensive understanding of paragraph content than that required by prior datasets. The dataset comprises fields including paragraphs, questions, and answer spans, and is divided into training and validation sets, which hold 77,400 and 9,535 examples respectively.

提供机构：

ucinlp

原始信息汇总

数据集概述

数据集名称

名称: DROP
别名: drop

数据集属性

语言: 英语 (en)
许可证: CC-BY-SA-4.0
多语言性: 单语种
大小: 10K<n<100K
来源: 原始数据
任务类别:
- 问答
- 文本到文本生成
任务ID:
- 提取式问答 (extractive-qa)
- 摘要式问答 (abstractive-qa)

数据集结构

特征:
- section_id: 字符串类型
- query_id: 字符串类型
- passage: 字符串类型
- question: 字符串类型
- answers_spans: 序列类型，包含:
  - spans: 字符串类型
  - types: 字符串类型
数据分割:
- 训练集: 77400个样本，105572506字节
- 验证集: 9535个样本，11737755字节

数据集创建

注释创建者: 众包
语言创建者: 众包

数据集下载和大小

下载大小: 11538387字节
数据集大小: 117310261字节

搜集汇总

数据集介绍

构建方式

DROP数据集通过众包方式构建，旨在挑战机器阅读理解系统的离散推理能力。数据集的构建过程涉及从原始文本中提取段落，并设计需要离散操作（如加法、计数或排序）的问题。这些问题要求系统不仅理解文本内容，还需进行复杂的推理操作。数据集的构建过程经过精心设计，确保问题的多样性和复杂性，以推动自然语言处理领域的技术进步。

使用方法

使用DROP数据集时，研究人员可以通过加载数据集文件，获取包含段落、问题和答案的数据实例。数据集分为训练集和验证集，分别包含77,409和9,536个实例。研究人员可以利用这些数据进行模型训练和评估，特别关注模型在离散推理任务上的表现。通过分析模型在DROP上的表现，可以深入理解其在复杂阅读理解任务中的优势和不足。

背景与挑战

背景概述

DROP数据集由Allen Institute for AI于2019年推出，旨在推动阅读理解领域的研究。该数据集由Dheeru Dua、Yizhong Wang等研究人员主导开发，专注于要求模型在段落中进行离散推理的阅读理解任务。DROP包含约96,000个问题，这些问题通过众包方式生成，并经过对抗性设计，以确保问题复杂性。该数据集的核心研究问题在于模型不仅需要理解文本内容，还需执行诸如加法、计数或排序等离散操作。DROP的推出显著提升了阅读理解模型的推理能力，成为该领域的重要基准。

当前挑战

DROP数据集的主要挑战在于其问题设计的复杂性。首先，模型需要解决多步推理问题，这些问题通常涉及对段落中多个位置的引用解析，并在此基础上执行离散操作。这种任务要求模型具备更强的上下文理解和推理能力，远超传统阅读理解数据集的要求。其次，数据集的构建过程中，众包生成的对抗性问题增加了数据标注的难度，确保问题的多样性和复杂性。此外，数据集中可能存在潜在的偏差，例如某些问题类型或答案分布的不均衡，这为模型的公平性和鲁棒性带来了额外挑战。

常用场景

经典使用场景

DROP数据集在自然语言处理领域中被广泛用于阅读理解任务的评估与模型训练。其独特的离散推理要求使得模型不仅需要理解文本内容，还需进行复杂的逻辑运算，如加法、计数和排序等。这一特性使得DROP成为评估模型在复杂推理任务中表现的重要基准。

解决学术问题

DROP数据集解决了传统阅读理解任务中模型仅依赖浅层文本理解的局限性。通过引入离散推理任务，DROP推动了模型在深层次语义理解和逻辑推理能力上的研究，显著提升了模型在处理复杂问题时的表现。这一突破为自然语言处理领域的研究提供了新的方向。

实际应用

在实际应用中，DROP数据集被用于开发智能问答系统和自动化文档分析工具。这些系统能够从大量文本中提取关键信息，并执行复杂的逻辑操作，广泛应用于金融、医疗和法律等领域，帮助用户快速获取精确的答案和决策支持。

数据集最近研究