TeleTableBench
收藏TeleTableBench 数据集概述
基本信息
- 任务类别: 表格问答
- 语言: 中文、英文
数据集简介
TeleTableBench 是业内首个面向真实工业场景的“表格生成报告”基准数据集。该数据集包含中英双语场景,覆盖 6 个一级大类和 19 个二级业务小类,包括汽车、能源、金融、政务、财务、科技、教育、银行等垂直领域。
数据特点
- 覆盖工业级表格类别最全的数据集
- 包含多种工业领域特有的复杂表格场景:
- 单表多 sheet
- 多表多 sheet
- 复杂结构表
- 超大宽表
- 包含最复杂场景的表格数据和最长的答案标准
任务描述
面向真实工业场景的“表格生成报告”任务,在工业应用中有广泛需求,如:
- 商业智能(BI)
- 表格分析工具
- 企业级报告生成
数据内容
- 工业场景的表格数据
- 经人工校对的高质量问题
- 高质量标注的报告关键点(金标准)
数据构建
数据来源于真实工业场景,目前只开源部分高价值数据,全量数据会尽快公开。详细构建过程和人工核验机制请参考原论文。
引用信息
bibtext @misc{zhang2025t2rbenchbenchmarkgeneratingarticlelevel, title={T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial Tables}, author={Jie Zhang and Changzai Pan and Kaiwen Wei and Sishi Xiong and Yu Zhao and Xiangyu Li and Jiaxin Peng and Xiaoyan Gu and Jian Yang and Wenhan Chang and Zhenhe Wu and Jiang Zhong and Shuangyong Song and Yongxiang Li and Xuelong Li}, year={2025}, eprint={2508.19813}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2508.19813}, }




