five

MAPBench-V1 and MAPBench-V2

收藏
github2026-02-05 更新2026-02-06 收录
下载链接:
https://github.com/AMAP-ML/Thinking-with-Map
下载链接
链接失效反馈
官方服务:
资源简介:
我们发布了两个版本的数据集。V1包含论文中使用的训练和测试数据(分辨率较低,将被弃用)。我们还提供了V2,具有更高分辨率的图像(推荐):发布的训练集包括6k样本的子集,测试集与V1大小相同(约2.5k样本)。

We have released two versions of this dataset. Version V1 contains the training and test data used in the paper, which has a lower resolution and will be deprecated. We also provide Version V2, which features higher-resolution images and is recommended: the released training set includes a subset of 6k samples, while the test set has the same size as that of V1, with approximately 2.5k samples.
创建时间:
2026-01-07
原始信息汇总

数据集概述

数据集名称

Thinking with Map: Reinforced Parallel Map-Augmented Agent for Geolocalization

数据集简介

该项目包含用于“Thinking with Map”的代码库、数据集和检查点。“Thinking with Map”是一个用于地理定位的地图增强智能体。给定一张真实环境中的图像,该智能体能够结合地图进行推理,推断出位置信息。

数据集版本与访问

数据集发布两个版本:

  • V1版本:包含论文中使用的训练和测试数据(分辨率较低,将被弃用)。
  • V2版本:提供更高分辨率的图像(推荐使用)。发布的训练集包含6k样本的子集,测试集大小与V1版本相同(约2.5k样本)。

访问地址

  • V1版本(低分辨率,将被弃用)
    • ModelScope: https://modelscope.cn/datasets/yux1ang/MAPBench-V1
  • V2版本(高分辨率,推荐)
    • ModelScope: https://modelscope.cn/datasets/yux1ang/MAPBench-V2

模型信息

  • Qwen3-VL-30B-A3B RL-tuned on MAPBench-V2 37k:在MAPBench-V2 37k数据集上进行强化学习调优的模型。

使用说明

数据预处理

下载数据集后,需将其处理为parquet格式。 bash cd verl/examples/data_preprocess bash preprocess_thinking_with_map.sh

推理

下载模型后,可通过vllm服务器使用。 bash vllm serve /path/to/released/model --tensor-parallel-size 2 --port 8002

随后可使用 demo/cookbook_thinking_with_map.ipynb 尝试演示。

训练

在每个集群节点上启动带缓存的工具服务器。 bash cd verl/tool_server bash run_api_server.sh $RANK

在每个集群节点上运行分布式强化学习训练。 bash cd verl/geoagent_scripts bash train_thinking_with_map.sh

评估

评估代码同样基于VeRL框架运行。 bash cd verl/geoagent_scripts bash test_thinking_with_map.sh

相关资源

  • 项目页面:https://amap-ml.github.io/Thinking-with-Map
  • 论文地址:https://arxiv.org/abs/2601.05432
  • HuggingFace论文页:https://huggingface.co/papers/2601.05432

引用

bibtex @article{ji2026thinking, title={Thinking with Map: Reinforced Parallel Map-Augmented Agent for Geolocalization}, author={Ji, Yuxiang and Wang, Yong and Ma, Ziyu and Hu, Yiming and Huang, Hailang and Hu, Xuecai and Chen, Guanhua and Wu, Liaoni and Chu, Xiangxiang}, journal={arXiv preprint arXiv:2601.05432}, year={2026} }

搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与地理定位交叉领域,MAPBench数据集的构建体现了对现实世界场景的深度模拟。该数据集通过采集真实环境中的图像,并辅以地图信息进行标注,形成了用于训练和测试地理定位智能体的基础。V1版本作为初始发布,提供了较低分辨率的训练与测试样本;而V2版本则进一步优化,采用高分辨率图像,并扩充了训练集规模至约六千个样本,测试集则保持与V1相近的两千五百个样本量,确保了数据质量的提升与后续研究的适用性。
特点
MAPBench数据集的核心特点在于其紧密融合视觉与地理信息,为地图增强型智能体提供了丰富的推理素材。数据集不仅包含多样化的野外场景图像,还整合了对应的地图数据,使得模型能够进行多层次的空间推理。高分辨率的V2版本显著提升了图像细节的清晰度,有助于模型捕捉更细微的环境特征。同时,数据集的划分兼顾了训练与评估的需求,为地理定位任务的算法开发与性能比较奠定了可靠基准。
使用方法
使用MAPBench数据集时,研究人员需首先从指定平台下载数据文件,并按照提供的预处理脚本将其转换为parquet格式,以便后续高效读取。数据加载后,可结合VeRL等强化学习框架进行模型训练,具体流程包括启动工具服务器、配置分布式训练环境,并执行相应的训练与评估脚本。对于推理阶段,用户可通过vLLM服务器部署预训练模型,并利用配套的演示笔记本来验证智能体在地理定位任务中的实际表现。
背景与挑战
背景概述
地理定位作为计算机视觉与人工智能交叉领域的关键研究方向,旨在通过视觉信息推断图像拍摄的地理位置。MAPBench-V1与MAPBench-V2数据集由厦门大学与阿里巴巴高德团队于2026年联合构建,核心研究问题聚焦于开发能够结合地图进行推理的智能体,以解决野外环境下的精准地理定位任务。该数据集的推出,不仅为地理定位研究提供了标准化评估基准,还通过引入高分辨率图像与强化学习框架,显著推动了多模态推理与自主决策智能体的发展,对自动驾驶、增强现实等应用领域产生了深远影响。
当前挑战
在地理定位领域,主要挑战在于模型需从复杂多变的自然场景中提取有效视觉特征,并关联至广阔的地理空间信息,这要求算法具备强大的跨模态理解与空间推理能力。数据集构建过程中,团队面临数据采集与标注的高成本难题,包括获取全球范围内多样化、高分辨率的野外图像,并确保其与精确地图坐标的对齐。此外,数据隐私与版权问题亦需谨慎处理,以平衡研究开放性与合规性要求。
常用场景
经典使用场景
在地理定位研究领域,MAPBench数据集为地图增强型智能体提供了标准化的评估基准。该数据集通过构建包含真实世界图像与对应地理坐标的配对样本,为模型学习空间推理能力创造了理想条件。研究者通常利用该数据集训练智能体从单张图像中提取视觉线索,并借助地图信息进行多步推理,最终实现精确的地理位置推断。这一过程模拟了人类结合视觉感知与先验地理知识进行定位的认知机制,为探索机器空间智能提供了关键实验平台。
实际应用
在现实应用层面,基于MAPBench训练的地图增强智能体展现出广泛的应用前景。自动驾驶系统可利用该技术实现无GPS信号环境下的车辆自主定位,通过识别道路景观与高精地图的匹配关系确保导航可靠性。应急救援场景中,救援人员通过拍摄现场图像即可快速确定事故位置,极大提升了搜救效率。此外,该技术还可应用于增强现实导航、地理信息检索、文化遗产数字化记录等领域,将学术研究成果转化为提升社会生产效率与公共服务质量的实际工具。
衍生相关工作
MAPBench数据集的发布催生了地理定位方向的一系列创新研究。以‘Thinking with Map’为代表的强化学习框架启发了后续工作对多智能体协同定位范式的探索,如采用分布式推理架构提升定位效率。部分研究将该数据集与视觉语言大模型结合,开发出支持自然语言交互的地理问答系统。另有工作扩展了数据集的模态范围,引入卫星影像、街景时序数据等多源信息,构建了更丰富的空间上下文表征。这些衍生研究共同推动了地理人工智能从单一图像匹配向复杂空间推理的范式转变。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作