tasksource/autotnli
收藏Hugging Face2023-05-31 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/tasksource/autotnli
下载链接
链接失效反馈官方服务:
资源简介:
该数据集旨在通过半自动化的框架增强表格推理的自然语言推理(NLI)任务的训练数据。现有的方法要么通过众包,要么通过全自动方法构建训练数据,但前者昂贵且耗时,后者则可能生成缺乏复杂推理的简单示例。本文开发了一种现实的半自动化框架,用于表格推理的数据增强。该方法生成可转移到类似表格的假设模板,并基于人类编写的逻辑约束和前提改写创建合理的反事实表格。案例研究使用了InfoTabS数据集,结果表明该框架能够生成类似人类的表格推理示例,有助于在监督有限的情况下进行训练数据增强。
提供机构:
tasksource
原始信息汇总
数据集概述
许可证
- Apache 2.0
语言
- 英语(en)
任务标识
- 自然语言推理(natural-language-inference)
任务类别
- 文本分类(text-classification)
数据集描述
- 标题:Realistic Data Augmentation Framework for Enhancing Tabular Reasoning
- 作者:Kumar, Dibyakanti; Gupta, Vivek; Sharma, Soumya; Zhang, Shuo
- 会议:Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing
- 日期:2022年12月
- 地点:在线和阿布扎比
- 出版商:Association for Computational Linguistics
- 摘要:现有的自然语言推理(NLI)任务训练数据构建方法,如半结构化表格推理,要么通过众包,要么通过全自动方法。然而,前者成本高且耗时,因此限制了规模,而后者往往产生缺乏复杂推理的简单示例。本文开发了一个现实半自动化的数据增强框架,用于表格推理。我们的方法不是为每个表格手动生成假设,而是生成可转移到类似表格的假设模板。此外,我们的框架涉及基于人类编写的逻辑约束创建合理的反事实表格和前提改写。在我们的案例研究中,我们使用了InfoTabS(Gupta et al., 2020),这是一个以实体为中心的表格推理数据集。我们观察到,我们的框架可以生成类似人类的表格推理示例,这可以有利于训练数据增强,特别是在监督有限的情况下。



