TableBench 表格问答基准

超神经2024-08-30 更新2024-12-14 收录

下载链接：

https://hyper.ai/cn/datasets/33718

下载链接

链接失效反馈

官方服务：

资源简介：

为了更好地评估 LLM 在表格问答方面的能力，北京航空航天大学、滑铁卢大学、复旦大学和北京信息科技大学的研究团队联合发布了 TableBench 表格问答基准，相关论文成果为「TableBench: A Comprehensive and Complex Benchmark for Table Question Answering」。

To better evaluate the capabilities of large language models (LLMs) in table question answering, research teams from Beihang University, University of Waterloo, Fudan University, and Beijing Information Science and Technology University jointly released the TableBench table question answering benchmark. The associated academic paper is titled "TableBench: A Comprehensive and Complex Benchmark for Table Question Answering".

创建时间：

2024-08-26

搜集汇总

数据集介绍

背景与挑战

背景概述

TableBench 表格问答基准是由北京航空航天大学、滑铁卢大学、复旦大学和北京信息科技大学联合发布的人工注释表格问答基准，包含18个领域的886个样本，旨在评估LLM在表格问答方面的能力，并促进事实核查、数字推理等任务。此外，团队还开源了TableInstruct指令语料库以指导LLM推理。

以上内容由遇见数据集搜集并总结生成