HieraDate
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/HieraDate
下载链接
链接失效反馈官方服务:
资源简介:
已经提出了几种多跳阅读理解数据集来解决推理快捷方式的问题,通过这些快捷方式可以在不执行多跳推理的情况下回答问题。但是,在找到比较问题的答案时,多跳模型执行逐步推理的能力尚不清楚。还不清楚有关内部推理过程的问题如何用于培训和评估问题回答 (QA) 系统。为了以分层的方式精确评估模型,我们首先提出了一个数据集,HieraDate,除了主要问题之外,还有三个探测任务: 提取,推理和鲁棒性。我们的数据集是通过增强之前的两个多跳数据集HotpotQA和2WikiMultiHopQA创建的,重点是关于日期信息的多跳问题,涉及比较和数字推理。然后,我们评估现有模型理解日期信息的能力。我们的实验结果表明,即使多跳模型在日期比较和数字减法任务中表现良好,它们也无法减去两个日期。其他结果表明,我们的探测问题可以帮助提高主要QA任务上模型的性能 (例如,通过10.3 F1),我们的数据集可以用于数据增强,以提高模型的鲁棒性。
提供机构:
OpenDataLab
创建时间:
2022-11-24
搜集汇总
数据集介绍

背景与挑战
背景概述
HieraDate是一个基于HotpotQA和2WikiMultiHopQA构建的多跳阅读理解数据集,专注于日期比较和数字推理问题,包含提取、推理和鲁棒性三个探测任务。该数据集旨在评估模型的分层推理能力,并可通过数据增强提升模型在主要QA任务上的性能。
以上内容由遇见数据集搜集并总结生成



