tasksource/equate
收藏Hugging Face2023-04-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tasksource/equate
下载链接
链接失效反馈官方服务:
资源简介:
EQUATE(评估文本蕴含中的定量理解能力)是一个新的框架,用于评估文本蕴含中的定量推理能力。EQUATE包含五个NLI测试集,这些测试集涉及数量。其中三个测试集使用来自新闻文章和社交媒体等真实世界来源的语言(RTE、NewsNLI Reddit),另外两个是控制合成测试,评估模型在量词推理和简单算术运算方面的能力(AWP、Stress Test)。
提供机构:
tasksource
原始信息汇总
数据集概述
数据集名称
EQUATE (Evaluating Quantitative Understanding Aptitude in Textual Entailment)
数据集描述
EQUATE是一个用于评估文本蕴含中定量推理能力的新框架。该框架包含五个NLI测试集,其中涉及数量。
测试集详情
- 来源类型:
- 三个测试集来自真实世界的数据源,如新闻文章和社交媒体(RTE, NewsNLI Reddit)。
- 两个测试集为控制合成测试,评估模型对量词的推理能力和进行简单算术的能力(AWP, Stress Test)。
许可证
Apache-2.0
引用信息
bib @article{ravichander2019equate, title={EQUATE: A Benchmark Evaluation Framework for Quantitative Reasoning in Natural Language Inference}, author={Ravichander, Abhilasha and Naik, Aakanksha and Rose, Carolyn and Hovy, Eduard}, journal={arXiv preprint arXiv:1901.03735}, year={2019} }



