AIT-QA
收藏arXiv2021-06-24 更新2024-06-21 收录
下载链接:
https://github.com/IBM/AITQA
下载链接
链接失效反馈官方服务:
资源简介:
AIT-QA是一个专注于航空业复杂表格问题的问答数据集,由IBM研究院创建。该数据集包含515个由人工标注者针对116个从美国SEC公开文件中提取的表格提出的问题。数据集不仅包含复杂表格结构,还包括行业特定术语和层次化列/行头标注。AIT-QA旨在解决现有模型在处理特定领域复杂表格时的不足,推动问答系统在该领域的应用和发展。
AIT-QA is a question answering dataset focused on complex tabular problems in the aviation industry, created by IBM Research. This dataset contains 515 questions proposed by human annotators for 116 tables extracted from publicly available U.S. SEC filings. The dataset not only features complex table structures, but also includes industry-specific terminology and hierarchical column/row header annotations. AIT-QA aims to address the shortcomings of existing models when dealing with complex tables in specific domains, and promote the application and development of question answering systems in this field.
提供机构:
IBM研究院
创建时间:
2021-06-24
搜集汇总
数据集介绍

构建方式
AIT-QA数据集的构建基于美国证券交易委员会(SEC)公开的10-K财务报告,涵盖了2017至2019年五家主要航空公司的财务数据。数据集包含116个复杂结构的表格,并由人工标注者基于这些表格生成了515个问题。标注过程中,特别关注了问题的类型(如KPI驱动或表格驱动)、是否依赖于行头层次结构以及是否为原问题或其改写版本。此外,数据集还包括了对表格列头和行头的层次结构识别,以确保模型能够处理这些复杂结构。
特点
AIT-QA数据集的显著特点在于其复杂表格结构,包括层次化的行头和列头,以及特定领域的术语。这些表格来源于航空行业的财务报告,具有高度的专业性和复杂性。数据集中的问题不仅涵盖了常见的KPI指标,还包括了需要理解复杂表格结构的查询,这使得AIT-QA成为评估和提升表格问答系统在特定领域应用能力的重要资源。
使用方法
AIT-QA数据集适用于评估和训练表格问答系统,特别是那些需要处理复杂表格结构和特定领域术语的系统。研究者可以使用该数据集来测试现有模型的性能,并通过对比不同模型在处理层次化行头和列头问题上的表现,来改进和优化表格问答算法。此外,数据集还可用于开发新的预处理技术,以简化复杂表格结构,使其更适合现有模型的输入要求。
背景与挑战
背景概述
近年来,随着Transformer技术的发展,表格问答(Table Question Answering, Table QA)系统在开放领域数据集如WikiTableQuestions和WikiSQL上取得了高准确率和最先进的结果。然而,这些Transformer模型通常在Wikipedia等开放领域内容上进行预训练,这些内容中的表格结构相对简单,第一行作为唯一的列标题。相比之下,特定领域的商业或科学文档中的表格通常具有更复杂的布局,包括层次化的行和列标题,以及该领域特有的专业术语。为了解决这一问题,我们引入了特定领域的表格问答数据集AIT-QA(Airline Industry Table QA)。该数据集包含515个由人工标注者编写的问题,基于从美国证券交易委员会(SEC)公开文件中提取的116个表格,涵盖2017-2019财年主要航空公司的财务报告。
当前挑战
AIT-QA数据集的主要挑战在于其复杂的表格结构,包括层次化的行和列标题,以及特定领域的术语。这些复杂性使得现有的最先进表格问答方法(如TaPAS、TaBERT和RCI)在实际应用中的表现受限,最佳准确率仅为51.8%(RCI)。此外,构建过程中遇到的挑战包括从复杂表格中提取信息,以及将这些复杂表格转换为适合现有表格问答模型的布局。这些挑战不仅影响了模型对表格内容的理解,还限制了其在特定领域应用中的实用性。
常用场景
经典使用场景
AIT-QA数据集的经典使用场景在于评估和提升针对复杂表格结构的问题回答系统。该数据集包含了从航空业财务报告中提取的116个复杂表格,以及由人类标注者基于这些表格生成的515个问题。这些问题不仅涉及表格的基本内容,还要求理解表格中的层次行和列标题,以及特定领域的术语。通过使用AIT-QA,研究人员可以测试和改进现有的表格问答模型,使其能够更好地处理具有复杂结构的领域特定表格。
解决学术问题
AIT-QA数据集解决了现有表格问答数据集在处理复杂表格结构和领域特定术语方面的不足。传统数据集如WikiTableQuestions和WikiSQL主要基于简单的表格结构,缺乏层次行和列标题以及特定领域的词汇。AIT-QA通过引入复杂表格和领域特定问题,填补了这一研究空白,推动了表格问答系统在处理实际业务和科学文档中的应用。
衍生相关工作
AIT-QA数据集的发布激发了相关领域的进一步研究,特别是在表格理解和问答系统的改进方面。例如,一些研究工作已经开始探索如何利用AIT-QA中的复杂表格结构来提升模型的性能,如通过改进表格预处理技术和引入更复杂的模型架构。此外,AIT-QA的成功也鼓励了在其他领域创建类似的复杂表格问答数据集,以推动该领域的整体发展。
以上内容由遇见数据集搜集并总结生成



