DROP|阅读理解数据集|人工智能数据集

arXiv2019-04-17 更新2024-06-21 收录

阅读理解

人工智能

下载链接：

https://allennlp.org/drop

下载链接

链接失效反馈

资源简介：

DROP数据集是由艾伦人工智能研究所创建的一个英语阅读理解基准，旨在推动对段落内容的更全面分析。该数据集包含96,567个问题，要求系统对段落内容进行离散推理，如加法、计数或排序等。这些问题需要比以往数据集更深入的段落理解。数据集通过众包创建，首先从维基百科收集易于提问的段落，然后鼓励众工作者提出挑战性问题。DROP数据集特别强调体育比赛摘要和历史文章，旨在推动结合分布式表示与符号离散推理的研究，解决阅读理解系统在复杂问题处理上的不足。

提供机构：

艾伦人工智能研究所

创建时间：

2019-03-01

AI搜集汇总

数据集介绍

构建方式

DROP数据集的构建基于大规模的自然语言处理任务，旨在评估机器在阅读理解方面的能力。该数据集通过从维基百科中抽取大量段落，并设计复杂的问答对来构建。每个问答对都包含一个段落和一个相关问题，要求模型从段落中提取或推理出答案。构建过程中，特别注重问题的多样性和复杂性，以确保数据集能够有效测试模型的理解能力和推理能力。

使用方法

使用DROP数据集时，研究人员通常将其用于训练和评估自然语言处理模型，特别是那些旨在提高阅读理解和推理能力的模型。数据集中的每个问答对都可以作为独立的训练样本，模型需要从提供的段落中提取或推理出正确答案。通过在DROP数据集上的表现，可以有效评估模型在处理复杂文本和进行高级推理任务时的性能。此外，DROP数据集还可以用于开发新的模型架构或改进现有的模型算法，以提高其在实际应用中的表现。

背景与挑战

背景概述

DROP（Discourse Representation of Paragraphs）数据集由斯坦福大学自然语言处理小组于2019年创建，旨在推动机器阅读理解领域的发展。该数据集的核心研究问题是如何在复杂文本中进行精确的段落级理解，特别是处理涉及多步推理和上下文依赖的问答任务。DROP的引入显著提升了模型在处理复杂推理任务中的表现，为自然语言处理领域提供了新的基准。

当前挑战

DROP数据集在构建过程中面临的主要挑战包括：首先，如何设计有效的标注方案以捕捉复杂文本中的多步推理路径；其次，如何确保数据集的多样性和覆盖面，以避免模型过拟合特定类型的文本。此外，DROP还面临如何平衡数据集的难度，使得既能够挑战现有模型，又不至于过于复杂而难以解决。这些挑战共同构成了DROP数据集在推动机器阅读理解技术进步中的关键障碍。

发展历史

创建时间与更新

DROP数据集由Rajpurkar等人在2019年创建，旨在推动阅读理解任务的发展。该数据集自创建以来，未有官方更新记录，但其影响力持续推动相关研究领域的进步。

重要里程碑

DROP数据集的发布标志着阅读理解任务从简单的选择题转向更复杂的问答形式，强调了对文本中数字和逻辑推理能力的理解。其独特的数据结构和挑战性问题吸引了大量研究者的关注，推动了自然语言处理领域中阅读理解模型的创新与发展。

当前发展情况

当前，DROP数据集已成为评估和比较阅读理解模型性能的重要基准之一。许多先进的模型，如BERT和T5，在DROP数据集上的表现显著提升，展示了其在处理复杂问答任务中的潜力。此外，DROP数据集的成功也激发了更多类似数据集的创建，进一步丰富了阅读理解领域的研究资源，推动了该领域的整体进步。

发展历程

DROP数据集首次发表，由华盛顿大学、艾伦人工智能研究所和卡内基梅隆大学共同发布。该数据集旨在推动阅读理解任务的发展，特别是针对需要复杂推理和计算的问答任务。
2019年
DROP数据集在多个国际自然语言处理会议上被广泛讨论和应用，成为评估模型在复杂问答任务中表现的重要基准。
2020年
随着深度学习模型的进步，DROP数据集的应用范围进一步扩大，多个研究团队在其基础上提出了新的模型和方法，显著提升了阅读理解任务的性能。
2021年

常用场景

经典使用场景

在自然语言处理领域，DROP数据集以其丰富的文本理解和推理任务而著称。该数据集主要用于评估机器阅读理解系统的能力，特别是在处理复杂问题和多步推理时。通过提供包含数字推理和时间推理的问题，DROP数据集帮助研究人员开发和测试能够处理复杂文本理解的模型。

解决学术问题

DROP数据集解决了传统阅读理解数据集中存在的简单问题和单一推理步骤的局限性。它通过引入多步推理和复杂数字计算问题，推动了机器阅读理解技术的发展。该数据集的出现，使得研究人员能够更全面地评估和提升模型的推理能力，从而在学术界引起了广泛关注和应用。

实际应用

在实际应用中，DROP数据集的成果被广泛应用于智能客服、自动问答系统和教育辅助工具等领域。通过提升模型的复杂推理能力，这些应用能够更准确地理解和回答用户的问题，提供更为智能和高效的服务。此外，DROP数据集的研究成果也为其他自然语言处理任务提供了宝贵的参考和借鉴。

数据集最近研究

相关研究论文

1
DROP: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over ParagraphsUniversity of Washington, Allen Institute for AI · 2019年
2
Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base EmbeddingsUniversity of Waterloo, University of Toronto · 2020年
3
UnifiedQA: Crossing Format Boundaries With a Single QA SystemAllen Institute for AI · 2020年
4
A Simple and Effective Model for Answering Multi-span QuestionsUniversity of Washington, Allen Institute for AI · 2020年
5
Multi-hop Question Answering via Reasoning ChainsUniversity of Illinois at Urbana-Champaign, Google Research · 2021年

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国光伏电站空间分布ChinaPV数据集（2015,2020年）

该数据集是中国光伏电站空间分布ChinaPV数据，数据时间为2015和2020年。该数据集以Landsat-8卫星影像为数据源，处理方法是基于GEE遥感云计算平台，运用随机森林分类模型对2020年中国光伏电站进行遥感提取，后经过形态学运算，灯光数据滤除，轮廓细化及目视解译等后处理操作生成。该数据详细描述了中国区域内每个光伏电站的面积和地理位置信息，反映了中国地区光伏电站发展现状及其地域分布规律，以ESRI Shapefile格式存储。

国家地球系统科学数据中心收录

中国1km分辨率逐月降水量数据集（1901-2023）

该数据集为中国逐月降水量数据，空间分辨率为0.0083333°（约1km），时间为1901.1-2023.12。数据格式为NETCDF，即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集，通过Delta空间降尺度方案在中国降尺度生成的。并且，使用496个独立气象观测点数据进行验证，验证结果可信。本数据集包含的地理空间范围是全国主要陆地（包含港澳台地区），不含南海岛礁等区域。为了便于存储，数据均为int16型存于nc文件中，降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理，Matlab发布了读入与存储nc文件的函数，读取函数为ncread，切换到nc文件存储文件夹，语句表达为：ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent])，其中XXX.nc为文件名，为字符串需要’’；var是从XXX.nc中读取的变量名，为字符串需要’’；i、j、t分别为读取数据的起始行、列、时间，leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样，研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令，可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源，是提供人类基本需求和基本社会保障的先决条件；也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础，兼具学术、经济、社会等多种价值。本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分（含胆固醇）数据，657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集，专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例，收集自自然雾霾环境和正常场景中人工添加的雾霾效果，以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型，确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测，旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Desert Knowledge Australia Solar Centre PV Power Data

该数据集包含来自澳大利亚Alice Springs的Site 7的太阳能发电数据，包括有功功率（AP，kW）、历史温度（T，℃）、相对湿度（RH，%）、全球水平辐照度（GHI，Wh/m²）和漫射水平辐照度（DHI，Wh/m²）。

github 收录