five

tasksource/imppres

收藏
Hugging Face2023-06-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tasksource/imppres
下载链接
链接失效反馈
官方服务:
资源简介:
IMPPRES数据集是一个用于自然语言推理(NLI)任务的诊断数据集,特别关注语用推理(如隐含意义和预设)。该数据集包含32K半自动生成的句子对,用于评估NLI模型在语用推理方面的能力。研究使用IMPPRES数据集评估了BERT、InferSent和BOW等模型在MultiNLI数据集上训练后是否能够进行语用推理。结果表明,BERT能够学习到一些语用推理,而BOW和InferSent在语用推理方面的表现较弱。
提供机构:
tasksource
原始信息汇总

数据集概述

数据集元数据

  • 许可证: Apache-2.0
  • 任务类别: 文本分类
  • 语言: 英语
  • 任务ID: 自然语言推理

数据集内容

  • 标题: Are Natural Language Inference Models IMPPRESsive? Learning IMPlicature and PRESupposition
  • 作者: Jeretić, Paloma; Warstadt, Alex; Bhooshan, Suvrat; Williams, Adina
  • 出版信息:
    • 会议: 第58届计算语言学年会
    • 日期: 2020年7月
    • 出版者: 计算语言学协会
    • 链接: ACL Anthology
    • DOI: 10.18653/v1/2020.acl-main.768
    • 页码: 8690-8705

数据集描述

  • 目的: 评估自然语言推理模型在处理含隐含意义和预设的句子对时的表现。
  • 数据集: IMPlicature and PRESupposition诊断数据集(IMPPRES),包含32,000个半自动生成的句子对。
  • 模型评估: 使用BERT, InferSent, 和BOW模型进行评估,这些模型均训练于MultiNLI数据集。
  • 发现:
    • BERT模型能够进行某些语用推理,如将“some”触发的量级隐含意义视为推断。
    • 对于某些预设触发词如“only”,BERT能够识别其预设为推断,即使在否定等取消推断的操作下。
    • BOW和InferSent模型在语用推理方面表现较弱。

结论

  • 自然语言推理训练鼓励模型学习某些,但非全部的语用推理。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作