five

TORQUE

收藏
github2024-03-10 更新2024-05-31 收录
下载链接:
https://github.com/qiangning/TORQUE-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
TORQUE是一个阅读理解数据集,专注于时间顺序问题。

TORQUE is a reading comprehension dataset focused on temporal ordering questions.
创建时间:
2020-11-10
原始信息汇总

TORQUE数据集概述

数据集基本信息

  • 名称: TORQUE数据集
  • 出版论文: 《TORQUE: A Reading Comprehension Dataset of Temporal Ordering Questions》
  • 作者: Ning, Qiang and Wu, Hao and Han, Rujun and Peng, Nanyun and Gardner, Matt and Roth, Dan
  • 出版会议: EMNLP (2020)

数据集内容

  • 数据存储位置: ./data

    • 内容: 包含整个数据集及原始的训练/开发/测试分割。测试集中的所有注释已被移除。
    • 附加文件: question_clustering.json,描述对比问题的集群。
  • 数据统计工具: ./basic_stats

    • 内容: 包含basic_stats.py脚本,用于生成论文中的Table 3, Figure 12, Figure 13, Figure 15, 和 Figure 16。注意,这些表格和图表是基于训练集生成的,可能与论文中的全数据集结果有细微差异。
  • 问题分类工具: ./Table2_sample_questions_categorization

    • 内容: 包含作者用于分类所有问题的原始电子表格及生成Table 2的Jupyter Notebook。
  • 学习曲线图: ./Fig11_learning_curve

    • 内容: 包含绘制Figure 11的Jupyter Notebook。

评估与交互

  • 评估: 请访问我们的排行榜进行评估。
搜集汇总
数据集介绍
main_image_url
构建方式
TORQUE数据集的构建基于对时间顺序问题的阅读理解需求,旨在评估模型在处理复杂时间关系时的能力。数据集通过精心设计的问答对形式呈现,每个问题均围绕文本中的时间顺序展开。构建过程中,研究者从大量文本中提取关键时间信息,并设计了一系列具有挑战性的问题,确保数据集能够全面覆盖不同时间关系的复杂性。此外,数据集还通过人工标注和自动化工具相结合的方式,确保了数据的准确性和多样性。
特点
TORQUE数据集的特点在于其专注于时间顺序问题的阅读理解,涵盖了广泛的时间关系类型,如先后顺序、持续时间等。数据集中的问题设计巧妙,既包含直接的时间顺序问题,也涉及需要推理的复杂问题。此外,数据集还提供了问题聚类信息,帮助研究者更好地理解问题的分布和结构。数据集的多样性和复杂性使其成为评估模型在时间顺序理解任务上性能的理想选择。
使用方法
使用TORQUE数据集时,研究者可以通过访问其官方网站获取详细的使用指南和评估标准。数据集提供了原始的训练、开发和测试集,其中测试集的标注信息已被移除,以确保评估的公正性。研究者可以通过提交模型预测结果到官方排行榜进行性能评估。此外,数据集还提供了多个脚本和工具,帮助研究者进行数据分析和可视化,如生成统计表格和绘制学习曲线。通过这些工具,研究者可以更深入地理解数据集的特性,并优化模型的性能。
背景与挑战
背景概述
TORQUE数据集由Qiang Ning、Hao Wu等研究人员于2020年发布,旨在解决阅读理解任务中的时间顺序问题。该数据集通过一系列时间顺序问题,挑战模型在文本中理解和推理事件发生顺序的能力。作为自然语言处理领域的重要资源,TORQUE为研究者提供了一个标准化的评估平台,推动了时间推理模型的发展。其发布在EMNLP会议上,进一步提升了该数据集在学术界的影响力,成为时间推理任务中的基准数据集之一。
当前挑战
TORQUE数据集在解决时间顺序推理问题时面临多重挑战。首先,时间顺序问题通常涉及复杂的事件链和模糊的时间表达,模型需要具备强大的上下文理解能力。其次,数据集的构建过程中,研究人员需确保问题的多样性和复杂性,以覆盖各种时间推理场景,这对标注质量和问题设计提出了高要求。此外,评估模型的性能时,如何准确衡量模型在时间顺序推理上的表现,也是一个亟待解决的技术难题。这些挑战共同推动了时间推理领域的研究进展。
常用场景
经典使用场景
TORQUE数据集在自然语言处理领域中被广泛应用于阅读理解任务,特别是针对时间顺序问题的研究。通过提供一系列关于文本中事件时间顺序的问题,该数据集为研究者提供了一个标准化的测试平台,用于评估和比较不同模型在处理复杂时间关系时的性能。
解决学术问题
TORQUE数据集解决了自然语言处理中一个关键问题,即如何有效地理解和推理文本中的时间顺序信息。通过提供丰富的时间顺序问题和详细的标注,该数据集帮助研究者开发出能够更准确地理解和推理时间关系的模型,从而推动了时间推理领域的研究进展。
衍生相关工作
TORQUE数据集的发布催生了一系列相关研究,特别是在时间推理和阅读理解模型方面。许多研究者基于该数据集提出了新的模型和算法,如基于图神经网络的时间推理模型和基于预训练语言模型的阅读理解系统。这些工作不仅提升了时间推理任务的性能,还为其他相关领域的研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作