TabMWP
收藏OpenDataLab2026-04-12 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/TabMWP
下载链接
链接失效反馈资源简介:
TabMWP一个新的数据集,其中包含38,431需要对文本和表格数据进行数学推理的开放域等级问题。TabMWP中的每个问题都与表格上下文对齐,表格上下文以图像,半结构化文本和结构化表格的形式显示。有两种类型的问题: 自由文本和多选择,每个问题都使用黄金解决方案进行注释,以揭示多步推理过程。
TabMWP is a novel dataset containing 38,431 open-domain grade-level questions that require mathematical reasoning over both textual and tabular data. Each question in TabMWP is aligned with a table context, which is presented in three formats: image, semi-structured text, and structured table. There are two types of questions: free-text and multiple-choice, and each question is annotated with gold solutions that reveal the multi-step reasoning process.
提供机构:
OpenDataLab
创建时间:
2023-09-04
搜集汇总
数据集介绍

背景与挑战
背景概述
TabMWP是一个包含38,431个表格数学应用题的数据集,专注于文本和表格数据的数学推理,问题分为自由文本和多选择两种类型,每个问题都配有黄金解决方案以展示多步推理过程。数据集具有丰富的多样性,包括28,876个不同问题、6,153个不同答案和35,442个不同解决方案,且每个问题必须依赖表格上下文才能解决,表格平均有5.9行和2.2列。该数据集适用于文本预训练、语言模型指令微调和数学推理任务,采用CC BY-NC-SA 4.0许可证。
以上内容由遇见数据集搜集并总结生成



