five

MapTrace

收藏
Hugging Face2025-11-14 更新2025-11-15 收录
下载链接:
https://huggingface.co/datasets/google/MapTrace
下载链接
链接失效反馈
官方服务:
资源简介:
MapTrace是一个合成数据集,专为路径追踪任务训练设计,包含200万个标注路径。数据集分为两部分:maptrace_parquet包含风格化地图上的路径,floormap_parquet包含结构化地图上的路径。每个路径数据包括原始地图图像字节数据、路径坐标列表的字符串表示、自然语言描述的路径查询问题以及地图的自然语言描述。

MapTrace is a synthetic dataset purpose-built for path tracing task training, containing 2 million annotated paths. The dataset is divided into two subsets: maptrace_parquet, which stores paths on stylized maps, and floormap_parquet, which contains paths on structured maps. Each path entry consists of the byte data of the original map image, the string representation of the path coordinate list, natural language path query questions, and the natural language description of the map.
提供机构:
Google
创建时间:
2025-10-31
原始信息汇总

MapTrace数据集概述

基本信息

  • 许可证: CC-BY-4.0
  • 任务类别: 图像到文本
  • 语言: 英语
  • 标签: 地图
  • 数据规模: 100万到1000万样本之间

数据集描述

MapTrace是一个包含200万标注样本的合成数据集,专门用于训练地图路径追踪任务模型。

数据格式

主要数据分割

  1. maptrace_parquet

    • 包含复杂风格化地图上的路径
    • 适用于宣传册、公园导览图或购物中心地图等场景
  2. floormap_parquet

    • 包含简单结构化平面图上的路径
    • 适用于办公楼、公寓小区或校园地图等场景

字段说明

  • image_bytes: 生成的地图图像原始字节(未经后处理)
  • label_text: 定义目标路径的坐标列表字符串表示,所有坐标归一化到0-1范围
  • input_text: 自然语言问题(提示),要求模型找到label_text中指定的路径
  • map_description: 地图图像的自然语言描述,用于文本到图像生成模型创建合成图像

论文数据分割

  • maptrace_20k: 论文中使用的数据分割
  • 字段架构:
    • image: 标注了起点和终点位置的地图图像字节
    • label: 定义目标路径的坐标列表字符串表示,所有坐标归一化到0-1范围
    • input: 自然语言问题(提示),要求模型找到label中指定的路径
搜集汇总
数据集介绍
main_image_url
构建方式
在数字地图与路径规划研究领域,MapTrace数据集通过合成生成技术构建了规模达200万样本的路径追踪数据。该数据集采用文本到图像的生成模型,依据自然语言描述自动创建多样化的地图图像,并标注归一化坐标路径。构建过程涵盖复杂风格化地图与简化结构平面图两类场景,确保数据在视觉复杂度和空间逻辑上的广泛代表性。
特点
MapTrace数据集的核心特点在于其多模态结构与任务导向设计。数据集融合图像字节流、坐标序列文本及自然语言提示,形成完整的路径追踪任务单元。其路径坐标均经过归一化处理,支持跨尺度地图的空间推理。数据划分为风格化地图与平面图两大子集,分别对应复杂场景与结构化环境,为模型泛化能力评估提供多层次基准。
使用方法
该数据集适用于图像到文本任务的模型训练与评估,使用者可通过解析图像字节与对应路径标注构建端到端学习流程。输入文本字段提供自然语言指令,引导模型在生成的地图图像中追踪指定路径。研究人员可分别利用风格化地图与平面图子集,验证模型在复杂视觉环境与规整空间结构中的路径推理性能。
背景与挑战
背景概述
随着人工智能在空间认知与导航领域的发展,MapTrace数据集于2024年由研究团队构建,旨在解决地图路径追踪这一核心问题。该数据集包含200万条合成样本,通过文本到图像生成技术模拟多样化地图场景,涵盖从复杂风格化地图到结构化平面图的广泛类型。其创新性在于将自然语言指令与坐标序列标注相结合,为多模态模型在路径规划、视觉问答等任务提供了大规模训练基础,显著推动了具身智能与地理信息系统的交叉研究。
当前挑战
地图路径追踪任务面临双重挑战:在领域层面,模型需同时解析视觉地图特征与自然语言指令的语义关联,并克服地图风格多样性导致的泛化困难;在构建过程中,合成数据的真实性成为关键瓶颈,需平衡生成效率与地理合理性,而坐标归一化标注则要求像素级空间精度,避免路径拓扑错误累积影响模型性能。
常用场景
经典使用场景
在空间认知与地理信息系统领域,MapTrace数据集为路径追踪任务提供了标准化基准。其核心应用场景聚焦于训练视觉语言模型解析复杂地图图像,通过自然语言指令引导模型识别并标注指定路径。该数据集涵盖从公园导览图到商场平面图的多样化地图类型,有效模拟真实世界中用户根据文字描述定位路径的认知过程。
衍生相关工作
受MapTrace启发,学术界涌现出多个创新性研究脉络。基于其多模态架构设计的MapVQA系列模型显著提升了地图问答任务的准确率;其坐标归一化标注方法被AdaptivePathNet等模型扩展应用于三维空间路径规划;此外,该数据集构建的合成数据流水线更催生了UrbanGen等城市地图生成系统的突破性进展。
数据集最近研究
最新研究方向
在数字地图与空间智能领域,MapTrace数据集正推动路径追踪任务的前沿探索。该数据集通过合成方法生成大规模地图图像与路径标注,为多模态模型在复杂场景下的空间推理能力提供关键训练资源。当前研究聚焦于结合视觉语言模型,探索其在旅游导航、应急路径规划等现实场景中的泛化性能,同时关注合成数据与真实地图的域适应问题。随着自动驾驶与室内机器人技术的发展,该数据集在提升机器对非结构化地图的理解方面展现出重要潜力,为空间认知计算开辟了新方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作