five

ChartComplete

收藏
arXiv2026-01-15 更新2026-01-17 收录
下载链接:
https://github.com/AI-DSCHubAUB/ChartComplete-Dataset/
下载链接
链接失效反馈
官方服务:
资源简介:
ChartComplete是由贝鲁特美国大学提出的一个综合性图表数据集,旨在解决现有图表理解基准数据集类型单一的问题。该数据集基于改进的Borkin分类法,涵盖30种图表类型,包括常见的柱状图、饼图以及较少见的平行坐标图等,每种类型包含50张高质量图像,总计1500条数据。数据来源包括Statista和Our World in Data等公开平台的爬取以及人工收集,经过严格的质量控制流程确保图像清晰度和信息完整性。该数据集主要应用于计算机视觉和自然语言处理领域,特别是图表问答(ChartQA)任务,为多模态大语言模型(MLLMs)的评估提供了更全面的基准。

ChartComplete is a comprehensive chart dataset proposed by the American University of Beirut, designed to address the issue of limited chart type diversity in existing chart understanding benchmark datasets. Built upon an improved Borkin taxonomy, this dataset covers 30 chart types, ranging from common ones like bar charts and pie charts to rare variants such as parallel coordinate plots. Each type includes 50 high-quality images, resulting in a total of 1500 data samples. The dataset's data is sourced from both web crawling of public platforms including Statista and Our World in Data, and manual collection, and has undergone strict quality control procedures to ensure image clarity and information integrity. This dataset is primarily applied in the fields of computer vision and natural language processing, particularly for the Chart Question Answering (ChartQA) task, serving as a more comprehensive benchmark for evaluating Multimodal Large Language Models (MLLMs).
提供机构:
贝鲁特美国大学
创建时间:
2026-01-15
搜集汇总
数据集介绍
main_image_url
构建方式
在图表理解领域,现有基准数据集往往局限于少数常见图表类型,难以全面评估多模态大语言模型的泛化能力。ChartComplete数据集的构建基于可视化领域的Borkin分类法,并对其进行了适应性调整,引入了堆叠变体与组合图表等类别,最终涵盖三十种图表类型。数据采集过程融合了自动化爬取与人工收集两种方式,从Statista、Our World in Data等权威数据平台以及各类在线资源中获取原始图像。通过Google ViT提取视觉特征并利用FAISS建立索引,结合近邻搜索与人工筛选,确保每种图表类型均包含五十张高质量图像,且遵循严格的图像内容与格式规范。
特点
ChartComplete数据集的核心特点在于其广泛的包容性与系统性分类。该数据集突破了以往基准数据集中仅包含柱状图、折线图等少数类型的局限,纳入了平行坐标图、箱线图、等高线地图等较为复杂或特殊的图表形式,从而更全面地覆盖了实际应用中可能遇到的图表多样性。数据集严格遵循经过修改的Borkin分类体系进行组织,结构清晰,便于研究者按类别进行访问与实验。所有图像均经过严格的质量控制,确保其具有高分辨率、清晰的文字标注、完整的图表元素(如标题、坐标轴、图例)以及真实的信息内容,避免了需要先验知识才能理解的符号或过于花哨的设计,为模型评估提供了贴近真实场景的可靠素材。
使用方法
ChartComplete数据集主要服务于图表分类与理解相关的研究,可作为评估多模态大语言模型或计算机视觉模型图表识别能力的基准。研究者可直接使用其提供的已分类图像目录进行模型训练或测试,验证模型在多种图表类型上的泛化性能。由于数据集目前仅提供分类图像而未附带问答或摘要等任务信号,因此它更适用于图像分类、特征学习或作为构建更复杂任务(如图表问答、图表摘要)的基础数据源。社区可在此基础上进一步标注,开发下游任务数据集。数据集以目录结构存储,按类别与类型分层组织,图像文件名中标注了采集方式(爬取或收集),便于用户根据需求进行筛选与分析。
背景与挑战
背景概述
随着深度学习与计算机视觉技术的飞速发展,图表理解领域正经历着深刻的变革。多模态大语言模型在图表解析任务中展现出卓越的效能与精度,然而现有评估基准多局限于少数常见图表类型,难以全面衡量模型的泛化能力。为填补这一空白,黎巴嫩贝鲁特美国大学的Ahmad Mustapha、Charbel Toumieh与Mariette Awad于2026年1月正式发布了ChartComplete数据集。该数据集借鉴可视化领域的分类体系,系统性地囊括了三十种图表类型,旨在为图表问答研究提供更具包容性的评估基准,推动跨模态智能系统在复杂视觉语言任务中的发展。
当前挑战
ChartComplete数据集致力于解决图表问答领域中模型泛化能力不足的核心挑战。现有基准大多仅覆盖柱状图、折线图等有限类型,难以反映真实场景中图表的多样性,导致模型在罕见图表类型上表现欠佳。在构建过程中,研究团队面临数据收集与质量控制的难题:部分图表类型在公开资源中极为稀缺,需通过人工方式系统性采集;同时需确保图像分辨率、标签清晰度、信息完整性符合严格标准,避免因视觉噪声或信息缺失影响模型评估效果。此外,当前版本仅提供分类图像,尚未集成问答或摘要等训练信号,限制了其直接应用于端到端任务的能力。
常用场景
经典使用场景
在图表理解与多模态大语言模型评估领域,ChartComplete数据集以其涵盖三十种图表类型的广泛包容性,成为衡量模型泛化能力的经典基准。该数据集基于可视化社区的分类法构建,从常见的柱状图、饼图到罕见的平行坐标图、箱线图等均有涉及,为研究人员提供了丰富的视觉多样性测试平台。通过这一数据集,学者能够系统评估模型在不同图表结构下的识别与解析性能,从而推动图表问答任务向更全面的方向发展。
衍生相关工作
ChartComplete数据集衍生了多项围绕图表分类与理解的经典研究工作。基于其丰富的图表类型,学者们开发了更先进的视觉特征提取模型,以改善跨图表特征的区分度。同时,该数据集激发了针对少见图表(如等高线图、树状图)的专用识别算法研究,并促进了多模态模型在图表问答任务上的适应性优化。这些工作共同推动了图表理解领域向更细粒度、更鲁棒的方向演进。
数据集最近研究
最新研究方向
在图表理解领域,随着多模态大语言模型的兴起,现有基准数据集在图表类型覆盖上的局限性日益凸显。ChartComplete数据集基于可视化分类学构建,涵盖了三十种图表类型,为评估模型在多样化图表上的泛化能力提供了关键资源。当前研究前沿聚焦于利用该数据集推动图表问答任务的进步,特别是在增强模型对复杂图表如平行坐标图、箱线图的视觉推理能力方面。这一进展与自动化数据分析和智能报告生成等热点应用紧密相连,有望提升人工智能在科学、商业等场景中处理视觉信息的准确性与效率。
相关研究论文
  • 1
    ChartComplete: A Taxonomy-based Inclusive Chart Dataset贝鲁特美国大学 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作