InfoTabS
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/InfoTabS
下载链接
链接失效反馈官方服务:
资源简介:
InfoTabS 包含基于前提的人类书面文本假设,这些前提是从维基百科信息框中提取的表格。在本文中,我们观察到半结构化表格文本无处不在;理解它们不仅需要理解文本片段的含义,还需要理解它们之间的隐含关系。我们认为,这些数据可以证明是理解我们如何推理信息的试验场。为了研究这一点,我们引入了一个名为 INFOTABS 的新数据集,其中包括基于前提的人工编写的文本假设,这些前提是从维基百科信息框中提取的表格。我们的分析表明,前提的半结构化、多领域和异构性质允许进行复杂的、多方面的推理。实验表明,虽然人类注释者同意表格-假设对之间的关系,但一些标准的建模策略在该任务中并不成功,这表明关于表格的推理可能会带来困难的建模挑战。
提供机构:
OpenDataLab
创建时间:
2022-06-23
搜集汇总
数据集介绍

背景与挑战
背景概述
InfoTabS是一个基于维基百科信息框表格构建的自然语言推理数据集,包含人类根据表格前提编写的文本假设,用于研究半结构化表格的复杂推理。该数据集的多领域和异构特性带来了建模挑战,现有标准方法在任务中表现不佳。
以上内容由遇见数据集搜集并总结生成



