tasksource/imppres

Name: tasksource/imppres
Creator: tasksource
Published: 2023-06-21 12:52:43
License: 暂无描述

Hugging Face2023-06-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/tasksource/imppres

下载链接

链接失效反馈

官方服务：

资源简介：

IMPPRES数据集是一个用于自然语言推理（NLI）任务的诊断数据集，特别关注语用推理（如隐含意义和预设）。该数据集包含32K半自动生成的句子对，用于评估NLI模型在语用推理方面的能力。研究使用IMPPRES数据集评估了BERT、InferSent和BOW等模型在MultiNLI数据集上训练后是否能够进行语用推理。结果表明，BERT能够学习到一些语用推理，而BOW和InferSent在语用推理方面的表现较弱。

提供机构：

tasksource

原始信息汇总

数据集概述

数据集元数据

许可证: Apache-2.0
任务类别: 文本分类
语言: 英语
任务ID: 自然语言推理

数据集内容

标题: Are Natural Language Inference Models IMPPRESsive? Learning IMPlicature and PRESupposition
作者: Jeretić, Paloma; Warstadt, Alex; Bhooshan, Suvrat; Williams, Adina
出版信息:
- 会议: 第58届计算语言学年会
- 日期: 2020年7月
- 出版者: 计算语言学协会
- 链接: ACL Anthology
- DOI: 10.18653/v1/2020.acl-main.768
- 页码: 8690-8705

数据集描述

目的: 评估自然语言推理模型在处理含隐含意义和预设的句子对时的表现。
数据集: IMPlicature and PRESupposition诊断数据集(IMPPRES)，包含32,000个半自动生成的句子对。
模型评估: 使用BERT, InferSent, 和BOW模型进行评估，这些模型均训练于MultiNLI数据集。
发现:
- BERT模型能够进行某些语用推理，如将“some”触发的量级隐含意义视为推断。
- 对于某些预设触发词如“only”，BERT能够识别其预设为推断，即使在否定等取消推断的操作下。
- BOW和InferSent模型在语用推理方面表现较弱。

结论

自然语言推理训练鼓励模型学习某些，但非全部的语用推理。

5,000+

优质数据集

54 个

任务类型

进入经典数据集