five

TeleTableBench

收藏
Hugging Face2025-09-04 更新2025-09-05 收录
下载链接:
https://huggingface.co/datasets/Tele-AI/TeleTableBench
下载链接
链接失效反馈
官方服务:
资源简介:
T2RBench是一个真实工业场景下的表格生成报告基准数据集,包含中英双语,覆盖多个行业领域,包括复杂表格场景,并提供人工校对的高质量问题和报告关键点标注。
创建时间:
2025-08-29
原始信息汇总

TeleTableBench 数据集概述

基本信息

  • 任务类别: 表格问答
  • 语言: 中文、英文

数据集简介

TeleTableBench 是业内首个面向真实工业场景的“表格生成报告”基准数据集。该数据集包含中英双语场景,覆盖 6 个一级大类和 19 个二级业务小类,包括汽车、能源、金融、政务、财务、科技、教育、银行等垂直领域。

数据特点

  • 覆盖工业级表格类别最全的数据集
  • 包含多种工业领域特有的复杂表格场景:
    • 单表多 sheet
    • 多表多 sheet
    • 复杂结构表
    • 超大宽表
  • 包含最复杂场景的表格数据和最长的答案标准

任务描述

面向真实工业场景的“表格生成报告”任务,在工业应用中有广泛需求,如:

  • 商业智能(BI)
  • 表格分析工具
  • 企业级报告生成

数据内容

  • 工业场景的表格数据
  • 经人工校对的高质量问题
  • 高质量标注的报告关键点(金标准)

数据构建

数据来源于真实工业场景,目前只开源部分高价值数据,全量数据会尽快公开。详细构建过程和人工核验机制请参考原论文。

引用信息

bibtext @misc{zhang2025t2rbenchbenchmarkgeneratingarticlelevel, title={T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial Tables}, author={Jie Zhang and Changzai Pan and Kaiwen Wei and Sishi Xiong and Yu Zhao and Xiangyu Li and Jiaxin Peng and Xiaoyan Gu and Jian Yang and Wenhan Chang and Zhenhe Wu and Jiang Zhong and Shuangyong Song and Yongxiang Li and Xuelong Li}, year={2025}, eprint={2508.19813}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2508.19813}, }

搜集汇总
数据集介绍
main_image_url
构建方式
TeleTableBench数据集的构建过程严格遵循工业级标准,采用多阶段人工核验机制确保数据质量。原始表格来源于真实业务场景,涵盖汽车、金融、政务等19个垂直领域,通过专业标注团队对表格结构解析、问题生成及报告关键点标注进行双重校验。构建流程包含数据清洗、复杂表格类型归类(如多sheet表、超大宽表)以及中英双语对齐,最终形成兼具广度和深度的基准数据。
使用方法
研究者可借助该数据集开展表格理解与报告生成的端到端评估,尤其适用于测试模型对工业级复杂表格的语义解析能力。使用时需加载表格数据及其对应的人工标注报告关键点,通过对比生成文本与金标准的匹配度评估性能。该基准支持多模态输入处理,建议结合预训练语言模型进行微调,或在商业智能分析工具中集成自动化报告生成模块。
背景与挑战
背景概述
表格到报告生成任务作为自然语言处理与商业智能交叉领域的前沿方向,旨在将结构化表格数据自动转化为连贯的篇章级分析报告。2025年由张杰等学者联合发布的TeleTableBench数据集,作为业界首个面向真实工业场景的双语基准,覆盖汽车、金融、政务等19个垂直领域,其多表多Sheet、复杂结构表等工业级特性显著推动了表格理解技术在实际应用中的深度发展。
当前挑战
该数据集核心挑战在于解决工业场景中表格结构的极端复杂性,如超大宽表的语义解析与多表关联推理,同时需生成符合行业规范的长篇报告。构建过程中面临双重困难:一是真实工业数据的敏感性与多样性导致高质量标注难度激增,二是需设计人工核验机制确保报告关键点的准确性与逻辑连贯性,这对标注一致性与领域知识深度提出了极高要求。
常用场景
经典使用场景
在自然语言处理与表格理解交叉领域,TeleTableBench数据集为表格到报告生成任务提供了经典实验平台。该数据集广泛应用于评估模型对多领域工业表格的深度解析能力,特别是在处理复杂表格结构时,研究者通过其验证模型能否从多sheet表格、超大宽表中提取关键信息并生成连贯报告。
解决学术问题
该数据集有效解决了工业级表格语义解析中的若干核心学术问题,包括跨模态表格理解、长文本生成的一致性维护以及领域自适应迁移学习。其意义在于填补了真实工业场景下表格报告生成系统性研究的空白,为构建可解释的表格分析模型提供了标准化评估体系,推动了结构化数据与自然语言生成的深度融合。
实际应用
在实际应用层面,TeleTableBench直接服务于商业智能分析、企业自动化报告生成和政务数据解读等场景。金融机构可借助该数据集训练的模型自动生成财务分析报告,能源企业能快速转化监测数据为运营洞察,其多语言特性更支持跨国企业的跨区域业务报告自动化生成。
数据集最近研究
最新研究方向
随着工业数字化转型的深入,表格问答领域正从传统的单元格内容提取转向复杂的语义理解和长篇报告生成。TeleTableBench作为业界首个面向真实工业场景的双语表格生成报告基准,推动了多模态表格理解与生成式人工智能的融合研究。该数据集涵盖汽车、金融、政务等19个垂直领域的复杂表格结构,包括多sheet表和超大宽表等工业特有场景,为探索大语言模型在商业智能分析、企业级报告自动生成等应用提供了关键支撑。其高质量的人工标注金标准不仅填补了表格生成报告任务的评估空白,更成为驱动可控文本生成、领域自适应等前沿技术发展的重要催化剂。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作