arabic_chartqa_ar

Hugging Face2025-06-19 更新2025-06-20 收录

下载链接：

https://huggingface.co/datasets/jinaai/arabic_chartqa_ar

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个从Arabic ChartQA数据集派生出来的数据集，将训练集重新格式化为测试集，并修改了字段名称，以便与ViDoRe评估基准兼容。数据集包含查询字符串、图片、图片文件名和文本描述等特征。

This is a dataset derived from the Arabic ChartQA dataset. It reformats the original training split into the test split and modifies the field names to be compatible with the ViDoRe evaluation benchmark. The dataset includes features such as query strings, images, image filenames, and textual descriptions.

创建时间：

2025-06-10

原始信息汇总

Arabic ChartQA Dataset 概述

数据集基本信息

来源：基于Arabic ChartQA dataset改造
用途：兼容ViDoRe评估基准

数据集结构

字段说明

query: 字符串类型，表示查询内容
image: 图像类型，存储图表图像
image_filename: 字符串类型，记录图像文件名
text_description: 字符串类型，提供文本描述

数据划分

test:
- 样本数量: 745
- 数据大小: 31.22 MB
- 文件格式: data/test-*

下载信息

下载大小: 13.69 MB
数据集总大小: 31.22 MB

搜集汇总

数据集介绍

构建方式

阿拉伯语图表问答数据集arabic_chartqa_ar源自原始Arabic ChartQA数据集，经过专业重构以适应ViDoRe评估基准的要求。构建过程中对训练集进行了测试集转换，并优化了字段命名体系，确保数据结构与评估框架完美兼容。该过程严格遵循跨模态数据处理规范，保留了原始数据的视觉-语言对应关系。

特点

作为专注于阿拉伯语图表理解的专业数据集，其显著特点在于同时包含视觉图像与文本描述的双模态特征。数据集囊括745个测试样本，每个样本由查询语句、图表图像、图像文件名及文本描述构成，形成完整的视觉问答体系。图像数据采用通用格式存储，文本部分则使用标准阿拉伯语标注，为中东语言信息处理研究提供了珍贵资源。

使用方法

该数据集主要服务于视觉文档理解领域的算法评估，研究人员可通过加载标准测试集进行端到端系统测试。使用时应同时调用图像与对应文本描述，建立跨模态关联分析。数据集兼容主流深度学习框架，支持直接输入视觉问答模型进行阿拉伯语场景下的图表理解能力测试，特别适合评估模型在复杂阿拉伯文字渲染图表中的认知性能。

背景与挑战

背景概述

阿拉伯语ChartQA数据集（arabic_chartqa_ar）是针对阿拉伯语视觉问答任务而构建的专项数据集，其衍生自原始阿拉伯语ChartQA数据集，由Ahmed Heakl等研究人员或机构主导开发。该数据集聚焦于解决阿拉伯语环境下图表理解与自然语言交互的核心研究问题，通过将原始训练集重构为测试集并调整字段命名，使其适配ViDoRe评估基准框架。作为阿拉伯语多模态研究领域的重要资源，该数据集填补了非拉丁语系视觉问答数据稀缺的空白，为跨语言信息处理研究提供了关键支撑。

当前挑战

该数据集面临的挑战主要体现在两方面：在领域问题层面，阿拉伯语复杂的形态结构和右向书写特性对图表文本识别与语义对齐提出更高要求，现有跨模态模型在低资源语言上的迁移性能亟待验证；在构建过程中，原始数据字段与目标评估框架的兼容性改造涉及复杂的格式转换与语义一致性维护，同时需确保重构后的测试集在数据分布和难度维度保持原始数据的代表性。

常用场景

经典使用场景

在自然语言处理与计算机视觉交叉领域，arabic_chartqa_ar数据集为阿拉伯语图表问答任务提供了标准化测试基准。该数据集通过将原始训练集重构为测试集，并调整字段命名规范，使其能够无缝适配ViDoRe评估框架，成为评估多模态模型理解阿拉伯语图表内容能力的黄金标准。研究人员可基于该数据集开展端到端的视觉-语言联合建模，验证模型从阿拉伯语图表中提取信息并生成准确回答的性能。

实际应用

在实际应用层面，该数据集支撑的模型可赋能阿拉伯地区的智能教育系统，自动解析教材中的统计图表并回答学生提问。在商业智能领域，能帮助阿拉伯语用户快速获取可视化报表的关键洞察。医疗场景下，可辅助医生解读阿拉伯语医疗数据可视化结果，提升诊断效率。其兼容ViDoRe框架的特性，更便于企业将模型集成到现有多语言服务体系中。

衍生相关工作

基于该数据集衍生的研究主要集中在三个方向：一是阿拉伯语视觉语言预训练模型如AraVL的优化工作，二是跨语言图表理解模型的知识迁移方法，三是针对右向左文本的视觉定位算法改进。其中Ahmed Heakl团队提出的阿拉伯语多模态对齐框架，通过在该数据集上的测试验证了文化适配特征提取器的有效性，相关成果发表于ACL等顶会。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集