five

tasksource/equate

收藏
Hugging Face2023-04-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tasksource/equate
下载链接
链接失效反馈
官方服务:
资源简介:
EQUATE(评估文本蕴含中的定量理解能力)是一个新的框架,用于评估文本蕴含中的定量推理能力。EQUATE包含五个NLI测试集,这些测试集涉及数量。其中三个测试集使用来自新闻文章和社交媒体等真实世界来源的语言(RTE、NewsNLI Reddit),另外两个是控制合成测试,评估模型在量词推理和简单算术运算方面的能力(AWP、Stress Test)。
提供机构:
tasksource
原始信息汇总

数据集概述

数据集名称

EQUATE (Evaluating Quantitative Understanding Aptitude in Textual Entailment)

数据集描述

EQUATE是一个用于评估文本蕴含中定量推理能力的新框架。该框架包含五个NLI测试集,其中涉及数量。

测试集详情

  • 来源类型
    • 三个测试集来自真实世界的数据源,如新闻文章和社交媒体(RTE, NewsNLI Reddit)。
    • 两个测试集为控制合成测试,评估模型对量词的推理能力和进行简单算术的能力(AWP, Stress Test)。

许可证

Apache-2.0

引用信息

bib @article{ravichander2019equate, title={EQUATE: A Benchmark Evaluation Framework for Quantitative Reasoning in Natural Language Inference}, author={Ravichander, Abhilasha and Naik, Aakanksha and Rose, Carolyn and Hovy, Eduard}, journal={arXiv preprint arXiv:1901.03735}, year={2019} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作