five

VisRAG-Ret-Test-ChartQA-enhanced

收藏
Hugging Face2025-10-25 更新2025-10-26 收录
下载链接:
https://huggingface.co/datasets/rweics5cs7/VisRAG-Ret-Test-ChartQA-enhanced
下载链接
链接失效反馈
官方服务:
资源简介:
VisRAG-Ret-Test-ChartQA-enhanced数据集是一个用于图表问答任务的数据集,包含三个主要部分:corpus(语料库,包括图片和对应的文本描述)、qrels(查询与语料库的相关性评分)、queries(查询信息,包括查询ID、查询内容、答案选项和是否为数值类型)。训练集包含500个示例。
创建时间:
2025-10-25
原始信息汇总

数据集概述

基本信息

  • 数据集名称: VisRAG-Ret-Test-ChartQA-enhanced
  • 存储位置: https://huggingface.co/datasets/rweics5cs7/VisRAG-Ret-Test-ChartQA-enhanced

配置结构

1. corpus配置

  • 特征字段:
    • corpus-id: 字符串类型
    • image: 图像类型
  • 数据分割:
    • train分割: 500个样本,73.91 MB
  • 下载大小: 73.91 MB
  • 数据集大小: 73.91 MB

2. qrels配置

  • 特征字段:
    • query-id: 字符串类型
    • corpus-id: 字符串类型
    • score: 32位整数类型
  • 数据分割:
    • train分割: 63个样本,2.87 KB
  • 下载大小: 3.20 KB
  • 数据集大小: 2.87 KB

3. queries配置

  • 特征字段:
    • query-id: 字符串类型
    • query: 字符串类型
    • answer: 字符串类型
    • options: 字符串序列
    • is_numerical: 32位整数类型
  • 数据分割:
    • train分割: 63个样本,7.69 KB
  • 下载大小: 7.76 KB
  • 数据集大小: 7.69 KB

数据文件结构

  • corpus数据文件路径: corpus/train-*
  • qrels数据文件路径: qrels/train-*
  • queries数据文件路径: queries/train-*
搜集汇总
数据集介绍
main_image_url
构建方式
在视觉文档分析领域,VisRAG-Ret-Test-ChartQA-enhanced数据集通过结构化配置精心构建,涵盖语料库、查询和相关性标注三个核心模块。语料库模块整合了500个图文样本,每个样本包含唯一标识符和高分辨率图像数据;查询模块收录63组问题及其标准答案,并标注数值类型特征;相关性标注模块则建立了查询与语料间的映射关系,形成完整的检索评估体系。
特点
该数据集以图表问答场景为核心特色,其多模态数据结构融合了视觉元素与文本语义。查询条目配备多选选项和数值类型标识,为复杂推理任务提供丰富上下文。紧凑的规模设计确保评估效率,同时通过精确的评分机制维持数据质量,为视觉语言模型检索能力测评建立标准化基准。
使用方法
研究人员可通过加载预定义配置快速接入三个数据模块,语料库提供视觉检索基础,查询集支撑问答任务生成,相关性标注则用于验证模型输出准确性。该架构支持端到端检索增强生成系统测试,开发者能分别调用图像编码、语义匹配和答案生成组件,在统一框架下完成多维度性能验证。
背景与挑战
背景概述
视觉检索增强生成技术作为多模态人工智能的前沿方向,旨在融合视觉信息与文本语义以实现精准问答。VisRAG-Ret-Test-ChartQA-enhanced数据集应运而生,其设计目标聚焦于图表类视觉内容的语义解析与答案生成,通过结构化存储图像、查询及关联标注,为跨模态推理研究提供标准化评估基准。该数据集由专业团队构建,体现了当前视觉语言理解领域对复杂信息交互能力的前瞻性探索。
当前挑战
图表问答任务需克服视觉元素与抽象概念的语义鸿沟,例如从柱状图中提取数值趋势或理解饼图的占比关系,这对模型的跨模态对齐能力提出严峻考验。数据构建过程中,标注者需精确匹配图像区域与自然语言描述,同时确保答案的数值逻辑一致性,此类细粒度标注易受主观判断干扰,增加了数据质量的管控难度。
常用场景
经典使用场景
在视觉文档分析领域,VisRAG-Ret-Test-ChartQA-enhanced数据集被广泛应用于测试检索增强生成系统对图表问答任务的性能。该数据集通过整合图像、查询和相关答案,为多模态模型提供了评估基准,尤其适用于验证模型在复杂图表数据中的信息提取与推理能力。
解决学术问题
该数据集有效解决了多模态检索中视觉与文本语义对齐的学术挑战,为研究社区提供了量化评估指标。其结构化标注促进了跨模态表示学习、视觉问答推理等核心问题的探索,显著推动了文档智能领域的技术标准化与理论发展。
衍生相关工作
基于该数据集衍生的经典研究包括多模态检索框架优化、图表理解模型的对抗训练方法等。这些工作进一步拓展了视觉语言预训练技术的边界,并为后续的文档级视觉推理任务奠定了实验基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作