REASONMAP-PLUS

Name: REASONMAP-PLUS
Creator: 西湖大学, 同济大学, 浙江大学, 新加坡国立大学
Published: 2025-10-03 01:29:46
License: 暂无描述

arXiv2025-10-03 更新2025-11-20 收录

下载链接：

https://hf-mirror.com/datasets/FSCCS/ReasonMap-Plus

下载链接

链接失效反馈

官方服务：

资源简介：

REASONMAP-PLUS是一个扩展的数据集，旨在通过视觉问答（VQA）任务引入密集奖励信号，以促进细粒度视觉理解技能的有效冷启动训练。该数据集由来自13个国家的30个城市的地图组成，包含4018个问题，涵盖了从简单的视觉理解到复杂的视觉推理任务。数据集的建设分为数据收集和预处理、基于设计构建问答对以及质量控制三个阶段。REASONMAP-PLUS的设计目的是为了解决现有多模态大型语言模型（MLLMs）在细粒度视觉推理任务中的挑战，如空间推理和细粒度视觉推理。

REASONMAP-PLUS is an extended dataset that introduces dense reward signals via Visual Question Answering (VQA) tasks to facilitate effective cold-start training for fine-grained visual understanding skills. Composed of maps from 30 cities across 13 countries, it contains 4018 questions spanning tasks ranging from simple visual understanding to complex visual reasoning. The dataset's development consists of three stages: data collection and preprocessing, design-aligned question-answer pair construction, and quality control. REASONMAP-PLUS is designed to address the challenges encountered by existing Multimodal Large Language Models (MLLMs) in fine-grained visual reasoning tasks, such as spatial reasoning and fine-grained visual reasoning.

提供机构：

西湖大学, 同济大学, 浙江大学, 新加坡国立大学

创建时间：

2025-10-03

搜集汇总

数据集介绍

构建方式

在交通地图视觉推理领域，REASONMAP-PLUS数据集通过系统化构建流程实现了知识扩展。该数据集基于原始REASONMAP的高分辨率交通地图和标注信息，采用设计导向的问答对生成策略，将问题类型从单一规划任务扩展到五大类别。构建过程遵循三阶段流程：数据收集与预处理阶段复用原有地图资源，问答对生成阶段基于预设计模板自动推导答案，质量管控阶段通过人工审核确保正确性与难度平衡。这种结构化构建方式产生了4018个涵盖计数与判断题型的样本，形成了从简单感知到复杂推理的自然难度递进。

使用方法

该数据集在强化学习框架中发挥着关键作用，其使用方法体现了课程学习的核心思想。研究者采用多阶段训练策略，首先利用REASONMAP-PLUS中的简单视觉问答任务进行冷启动训练，建立密集奖励信号下的基础视觉理解能力。随后逐步过渡到复杂推理任务，通过难度感知的奖励设计机制，将格式奖励、正确性奖励与细节奖励有机结合，并引入基于地图难度和问题复杂度的加权系数。这种循序渐进的使用方法不仅缓解了稀疏奖励问题，还确保了模型在视觉感知与空间推理能力上的均衡发展。

背景与挑战

背景概述

REASONMAP-PLUS数据集由西湖大学、同济大学、浙江大学和新加坡国立大学的研究团队于2025年联合构建，作为REASONMAP基准的扩展版本。该数据集聚焦于多模态大语言模型在结构化视觉场景中的细粒度视觉推理能力，特别针对交通地图这一信息密集场景的空间推理任务。通过引入从简单到困难的视觉问答任务，该数据集为强化学习训练提供了密集的奖励信号，有效解决了传统方法在复杂视觉推理任务中面临的冷启动难题，对推动多模态智能系统在现实导航和交通规划等领域的应用具有重要意义。

当前挑战

该数据集主要应对细粒度视觉推理领域的核心挑战：传统强化学习方法在复杂视觉任务中因奖励稀疏导致的优化不稳定问题。构建过程中面临双重挑战：一是需要设计合理的难度递进机制，确保从基础视觉感知到复杂空间推理的平滑过渡；二是需平衡数据多样性，通过人工审核确保自动生成问答对的准确性和难度分布的合理性，同时避免模型利用标签频率偏差。这些挑战的解决为多模态大语言模型在结构化视觉场景中的有效训练提供了重要支撑。

常用场景

经典使用场景

在细粒度视觉推理研究领域，REASONMAP-PLUS数据集通过构建从简单到复杂的任务序列，为多模态大语言模型提供了渐进式训练范式。该数据集以交通地图为视觉载体，涵盖从基础视觉问答到复杂空间推理的多层次任务，使得模型能够通过密集奖励信号逐步掌握细粒度视觉理解能力。这种结构化设计使得数据集成为评估模型在信息密集环境中视觉推理能力的标准测试平台。

解决学术问题

该数据集有效解决了细粒度视觉推理中奖励稀疏和优化不稳定的核心学术难题。通过引入基于视觉问答的密集奖励信号，REASONMAP-PLUS打破了传统强化学习在长推理链任务中仅依赖最终结果评估的局限。其难度感知的奖励设计和多阶段训练策略，为模型提供了从感知到推理的平滑过渡路径，显著提升了在结构化视觉输入上的推理性能，推动了多模态模型在复杂视觉环境中的认知边界。

实际应用

在实际应用层面，REASONMAP-PLUS为智能导航系统和城市交通规划提供了关键技术支撑。基于该数据集训练的模型能够准确解析高分辨率交通地图中的拓扑关系，实现精准的路线规划和站点定位。这种能力可直接应用于实时导航服务、公共交通优化和城市基础设施管理，为智慧城市建设提供可靠的视觉推理引擎，显著提升城市交通系统的智能化水平。

数据集最近研究