HuggingFaceM4/ChartQA
收藏Hugging Face2024-03-05 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/HuggingFaceM4/ChartQA
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: query
dtype: string
- name: label
list: string
- name: human_or_machine
dtype:
class_label:
names:
'0': human
'1': machine
splits:
- name: train
num_bytes: 1256446073.625
num_examples: 28299
- name: val
num_bytes: 84202126
num_examples: 1920
- name: test
num_bytes: 107049156.5
num_examples: 2500
download_size: 964095599
dataset_size: 1447697356.125
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: val
path: data/val-*
- split: test
path: data/test-*
license: gpl-3.0
---
# Dataset Card for "ChartQA"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 名称:image(图像),数据类型:图像
- 名称:query(查询文本),数据类型:字符串
- 名称:label(标签),数据类型:字符串列表
- 名称:human_or_machine(人工/机器来源标识),数据类型:分类标签(class_label),类别映射:'0' 对应 human(人类),'1' 对应 machine(机器)
数据集划分:
- 训练集(train):存储字节数1256446073.625,样本总量28299
- 验证集(val):存储字节数84202126,样本总量1920
- 测试集(test):存储字节数107049156.5,样本总量2500
下载总大小:964095599 字节
数据集总存储大小:1447697356.125 字节
配置项:
- 配置名称:default(默认配置),数据文件:
- split: train
路径:data/train-*
- split: val
路径:data/val-*
- split: test
路径:data/test-*
开源许可证:gpl-3.0(GNU通用公共许可证第3.0版)
---
# "ChartQA" 数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
HuggingFaceM4
原始信息汇总
数据集概述
数据集名称
- ChartQA
数据特征
- image: 图像数据类型
- query: 字符串数据类型
- label: 字符串列表数据类型
- human_or_machine: 分类标签数据类型,其中:
- 0: human
- 1: machine
数据集划分
- train: 28299个样本,总大小为1256446073.625字节
- val: 1920个样本,总大小为84202126字节
- test: 2500个样本,总大小为107049156.5字节
数据集大小
- 下载大小: 964095599字节
- 数据集总大小: 1447697356.125字节
配置信息
- config_name: default
- data_files:
- train: data/train-*
- val: data/val-*
- test: data/test-*
许可证
- GPL-3.0
搜集汇总
数据集介绍

构建方式
在信息可视化领域,ChartQA数据集的构建体现了对图表理解任务的深度探索。该数据集通过精心设计的流程,收集了涵盖多种图表类型的图像样本,并针对每张图表生成了对应的自然语言查询与答案。构建过程中,特别区分了人工标注与机器生成两种来源,确保了数据来源的多样性。训练集、验证集与测试集的划分遵循了标准机器学习实践,为模型评估提供了可靠基础。
特点
ChartQA数据集的核心特点在于其专注于图表问答任务,涵盖了丰富的图表视觉信息与语言交互。数据集中的图像特征与文本查询相结合,支持对图表内容的深入理解与推理。其标注体系不仅包含答案标签,还注明了标注来源,为研究人工与机器标注差异提供了可能。数据规模适中,划分清晰,适用于训练与评估复杂的多模态模型。
使用方法
使用ChartQA数据集时,研究者可将其应用于图表视觉问答模型的训练与测试。典型流程包括加载图像与对应查询,利用多模态架构进行特征提取与答案预测。验证集可用于超参数调优,测试集则用于最终性能评估。数据集支持直接通过HuggingFace库便捷访问,遵循标准数据拆分,便于集成到现有机器学习管道中。
背景与挑战
背景概述
在信息可视化领域,图表作为数据呈现的核心媒介,其自动问答能力对于提升数据交互效率具有关键意义。ChartQA数据集由HuggingFaceM4团队于近年构建,旨在推动图表理解与推理技术的前沿探索。该数据集聚焦于从复杂图表中提取并回答自然语言问题的核心研究问题,涵盖了柱状图、折线图、饼图等多种图表类型,为多模态人工智能模型提供了重要的训练与评估基准。其构建不仅促进了视觉语言理解模型的进展,也为金融分析、学术研究等领域的自动化数据洞察奠定了坚实基础。
当前挑战
ChartQA数据集面临的挑战主要体现在两个方面:在领域问题层面,图表问答要求模型深度融合视觉特征与文本语义,准确解析图表中的数值关系、趋势模式及隐含逻辑,这对模型的跨模态对齐与推理能力提出了极高要求;在构建过程中,数据收集需平衡真实性与多样性,确保涵盖不同图表风格与问题复杂度,同时人工标注需克服图表信息密集、答案歧义等困难,以保证数据质量与一致性。
常用场景
经典使用场景
在信息可视化领域,ChartQA数据集为图表理解与问答任务提供了关键资源。该数据集通过包含多种图表类型(如柱状图、折线图、饼图等)及其对应的自然语言问题与答案,支持模型学习从视觉图表中提取结构化信息并生成准确回答。经典使用场景涉及训练多模态模型,结合计算机视觉与自然语言处理技术,实现对图表内容的深度解析与推理,从而提升模型在复杂视觉问答任务中的表现。
实际应用
在实际应用中,ChartQA数据集支持自动化报告生成、商业智能分析与教育辅助工具的开发。例如,在金融或医疗领域,系统可自动解析图表中的关键指标,生成简明摘要或回答特定查询,提升数据决策效率。在教育场景中,它能够辅助学生通过问答互动学习图表解读技能。这些应用不仅减少了人工分析成本,还增强了数据可访问性,体现了多模态人工智能在现实世界中的实用价值。
衍生相关工作
围绕ChartQA数据集,衍生了一系列经典研究工作,主要集中在多模态预训练与视觉问答模型的优化上。例如,基于Transformer的架构被扩展以融合图像与文本特征,提升图表理解的精度。同时,研究探索了少样本学习与推理增强技术,以应对图表中罕见或复杂的问题类型。这些工作不仅丰富了视觉语言领域的理论框架,还催生了如ChartVLM等专用模型,进一步推动了自动化图表分析技术的发展与普及。
以上内容由遇见数据集搜集并总结生成



