Custom Bar Chart Dataset
收藏arXiv2025-01-09 更新2025-01-14 收录
下载链接:
http://arxiv.org/abs/2501.04675v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由Synechron创建,包含50,000个条形图,涵盖简单、堆叠和分组三种类型,专为金融领域的图表分析设计。数据集通过随机化标题、轴标签、类别和数值等元素,确保多样性和代表性。每个图表均配有结构化的JSON文件,包含图表的文本描述,作为模型训练的真实标签。数据集生成过程使用Python的Matplotlib和Seaborn库,确保图表的多样性和复杂性。该数据集主要用于训练和评估DEPLOT模型,提升其在金融图表中的数值和类别映射能力,旨在解决自动化图表解析中的精度和泛化问题。
This dataset, created by Synechron, contains 50,000 bar charts covering three types: simple, stacked, and grouped, and is specifically designed for chart analysis in the financial domain. To ensure diversity and representativeness, the dataset randomizes elements such as titles, axis labels, categories, and numerical values. Each chart is paired with a structured JSON file that contains the text description of the chart, serving as the ground-truth label for model training. The dataset generation process uses Python's Matplotlib and Seaborn libraries to guarantee the diversity and complexity of the generated charts. This dataset is primarily used for training and evaluating the DEPLOT model, enhancing its ability to map numerical values and categories in financial charts, with the aim of addressing the accuracy and generalization issues in automated chart parsing.
提供机构:
Synechron
创建时间:
2025-01-09
搜集汇总
数据集介绍

构建方式
Custom Bar Chart Dataset的构建采用了Python的Matplotlib和Seaborn库,生成了50,000张条形图,涵盖了简单、堆叠和分组条形图等多种类型。每张图表都保存为图像文件,并附带一个结构化的JSON文件,其中包含了图表的文本描述,作为模型训练的真实标签。通过随机化图表的标题、轴标签、类别和数值范围等元素,确保了数据集的多样性和领域相关性。
使用方法
该数据集主要用于训练和评估视觉语言模型(如DEPLOT),以提升其在金融图表解释中的表现。通过将图表图像转换为结构化的表格数据,模型能够更准确地提取和解释图表中的信息。此外,数据集还可用于评估大型语言模型(LLMs)在结合结构化表格数据时的推理能力,从而支持复杂的查询和问答任务。
背景与挑战
背景概述
Custom Bar Chart Dataset 是由 Synechron 的 Archita Srivastava、Abhas Kumar、Rajesh Kumar 和 Prabhakar Srinivasan 等研究人员于 2025 年创建的,旨在解决自动化模型在图表信息提取中的挑战。该数据集包含 50,000 个柱状图,涵盖简单、堆叠和分组柱状图,专注于这些可视化形式的独特结构特征。通过微调 DEPLOT 模型,该研究展示了如何将图表图像转换为线性化表格,从而提升大语言模型(LLMs)在图表推理任务中的表现。该数据集在金融领域的应用尤为突出,推动了视觉语言模型在自动化图表解释中的发展。
当前挑战
Custom Bar Chart Dataset 面临的挑战主要集中在两个方面:首先,自动化模型在处理图表信息提取时,常因图表结构、配置和复杂性的多样性而难以准确解析。尤其是在金融等特定领域,图表的独特特征进一步增加了提取难度。其次,数据集的构建过程中,研究人员需要确保生成的柱状图具有足够的多样性和复杂性,以覆盖实际应用中的各种场景。此外,如何通过微调 DEPLOT 模型来提升其在特定领域(如金融)中的表现,也是一个重要的技术挑战。这些挑战共同推动了该领域在图表解析和结构化数据生成方面的技术进步。
常用场景
经典使用场景
Custom Bar Chart Dataset 主要用于金融领域的图表解析任务,特别是针对柱状图的自动信息提取和结构化表示。该数据集通过提供50,000张包含简单、堆叠和分组柱状图的图像,帮助模型学习如何将视觉图表数据转换为线性化的表格数据。这种转换不仅提高了模型对图表中数值和类别信息的提取精度,还为后续的推理任务提供了结构化的中间表示。
解决学术问题
该数据集解决了自动化图表解析中的关键问题,特别是在金融领域中,图表结构的多样性和复杂性使得传统方法难以准确提取信息。通过微调DEPLOT模型,数据集显著提升了模型在数值解释(RNSS)和类别映射(RMS)方面的准确性。这种改进不仅增强了模型对金融图表的理解能力,还为其他领域的图表解析提供了可扩展的框架。
实际应用
在实际应用中,Custom Bar Chart Dataset 被广泛用于金融数据分析、商业智能和决策支持系统。通过将图表数据转换为结构化表格,模型能够更高效地处理复杂的金融报告,支持趋势分析、比较分析和预测任务。此外,该数据集还为大型语言模型(LLMs)提供了高质量的中间表示,使其能够更准确地回答与图表相关的复杂问题。
数据集最近研究
最新研究方向
在金融领域的视觉语言模型中,Custom Bar Chart Dataset的最新研究方向集中在通过中间结构化表示增强图表数据的自动解释能力。该数据集包含50,000张条形图,涵盖简单、堆叠和分组条形图,旨在通过微调DEPLOT模型,将图表图像转换为线性化表格,从而提升大语言模型(LLMs)的推理性能。研究表明,提供结构化中间表格相较于直接图像查询,显著提高了LLMs的推理准确性。这一方法不仅优化了数值和类别映射的准确性,还为金融领域的图表分析提供了更为可靠和精确的自动化解决方案。未来研究可进一步探索数据增强、模型集成和多模态融合架构,以应对更复杂的图表类型和领域需求。
相关研究论文
- 1Enhancing Financial VQA in Vision Language Models using Intermediate Structured RepresentationsSynechron · 2025年
以上内容由遇见数据集搜集并总结生成



