VisRAG-Ret-Test-ChartQA-enhanced

Hugging Face2025-10-25 更新2025-10-26 收录

下载链接：

https://huggingface.co/datasets/rweics5cs7/VisRAG-Ret-Test-ChartQA-enhanced

下载链接

链接失效反馈

官方服务：

资源简介：

VisRAG-Ret-Test-ChartQA-enhanced数据集是一个用于图表问答任务的数据集，包含三个主要部分：corpus（语料库，包括图片和对应的文本描述）、qrels（查询与语料库的相关性评分）、queries（查询信息，包括查询ID、查询内容、答案选项和是否为数值类型）。训练集包含500个示例。

创建时间：

2025-10-25

原始信息汇总

数据集概述

基本信息

数据集名称: VisRAG-Ret-Test-ChartQA-enhanced
存储位置: https://huggingface.co/datasets/rweics5cs7/VisRAG-Ret-Test-ChartQA-enhanced

配置结构

1. corpus配置

特征字段:
- corpus-id: 字符串类型
- image: 图像类型
数据分割:
- train分割: 500个样本，73.91 MB
下载大小: 73.91 MB
数据集大小: 73.91 MB

2. qrels配置

特征字段:
- query-id: 字符串类型
- corpus-id: 字符串类型
- score: 32位整数类型
数据分割:
- train分割: 63个样本，2.87 KB
下载大小: 3.20 KB
数据集大小: 2.87 KB

3. queries配置

特征字段:
- query-id: 字符串类型
- query: 字符串类型
- answer: 字符串类型
- options: 字符串序列
- is_numerical: 32位整数类型
数据分割:
- train分割: 63个样本，7.69 KB
下载大小: 7.76 KB
数据集大小: 7.69 KB

数据文件结构

corpus数据文件路径: corpus/train-*
qrels数据文件路径: qrels/train-*
queries数据文件路径: queries/train-*

搜集汇总

数据集介绍

构建方式

在视觉文档分析领域，VisRAG-Ret-Test-ChartQA-enhanced数据集通过结构化配置精心构建，涵盖语料库、查询和相关性标注三个核心模块。语料库模块整合了500个图文样本，每个样本包含唯一标识符和高分辨率图像数据；查询模块收录63组问题及其标准答案，并标注数值类型特征；相关性标注模块则建立了查询与语料间的映射关系，形成完整的检索评估体系。

特点

该数据集以图表问答场景为核心特色，其多模态数据结构融合了视觉元素与文本语义。查询条目配备多选选项和数值类型标识，为复杂推理任务提供丰富上下文。紧凑的规模设计确保评估效率，同时通过精确的评分机制维持数据质量，为视觉语言模型检索能力测评建立标准化基准。

使用方法

研究人员可通过加载预定义配置快速接入三个数据模块，语料库提供视觉检索基础，查询集支撑问答任务生成，相关性标注则用于验证模型输出准确性。该架构支持端到端检索增强生成系统测试，开发者能分别调用图像编码、语义匹配和答案生成组件，在统一框架下完成多维度性能验证。

背景与挑战

背景概述

视觉检索增强生成技术作为多模态人工智能的前沿方向，旨在融合视觉信息与文本语义以实现精准问答。VisRAG-Ret-Test-ChartQA-enhanced数据集应运而生，其设计目标聚焦于图表类视觉内容的语义解析与答案生成，通过结构化存储图像、查询及关联标注，为跨模态推理研究提供标准化评估基准。该数据集由专业团队构建，体现了当前视觉语言理解领域对复杂信息交互能力的前瞻性探索。

当前挑战

图表问答任务需克服视觉元素与抽象概念的语义鸿沟，例如从柱状图中提取数值趋势或理解饼图的占比关系，这对模型的跨模态对齐能力提出严峻考验。数据构建过程中，标注者需精确匹配图像区域与自然语言描述，同时确保答案的数值逻辑一致性，此类细粒度标注易受主观判断干扰，增加了数据质量的管控难度。

常用场景

经典使用场景

在视觉文档分析领域，VisRAG-Ret-Test-ChartQA-enhanced数据集被广泛应用于测试检索增强生成系统对图表问答任务的性能。该数据集通过整合图像、查询和相关答案，为多模态模型提供了评估基准，尤其适用于验证模型在复杂图表数据中的信息提取与推理能力。

解决学术问题

该数据集有效解决了多模态检索中视觉与文本语义对齐的学术挑战，为研究社区提供了量化评估指标。其结构化标注促进了跨模态表示学习、视觉问答推理等核心问题的探索，显著推动了文档智能领域的技术标准化与理论发展。

衍生相关工作

基于该数据集衍生的经典研究包括多模态检索框架优化、图表理解模型的对抗训练方法等。这些工作进一步拓展了视觉语言预训练技术的边界，并为后续的文档级视觉推理任务奠定了实验基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集