MapDataset
收藏github2018-05-05 更新2024-05-31 收录
下载链接:
https://github.com/olavvatne/MapDataset
下载链接
链接失效反馈官方服务:
资源简介:
用于机器学习应用的地图数据集创建工具,包括获取地图瓦片、组合图像、生成标签和组织数据集等功能。
A tool for creating map datasets for machine learning applications, including functionalities such as acquiring map tiles, combining images, generating labels, and organizing datasets.
创建时间:
2015-09-23
原始信息汇总
MapDataset 概述
数据集构建步骤
- 获取地图瓦片:
- 执行
tiles/aerial.py脚本,获取可配置边界框内的瓦片。
- 执行
- 合并瓦片:
- 使用
tiles/combiner.py脚本将瓦片合并成更大的图像。
- 使用
- 生成标签:
- 将
vector/tile_write.py脚本导入QGIS,为每张图像生成标签。此步骤需要QGIS和地图数据。- 下载N50地图数据(Kartverket)。
- 在QGIS中打开
norway.qgs文件。 - 通过 Plugins -> Python console 打开Python控制台。
- 编辑
vector/tile_writer.py脚本,修改 dir 和 output_dir 参数,并运行脚本。
- 将
- 组织数据集:
- 使用
dataset/formatter.py脚本组织图像和标签,为图像瓦片赋予新名称并随机化。
- 使用
- 创建数据集文件夹:
- 手动创建测试、验证和训练文件夹。
依赖项
搜集汇总
数据集介绍

构建方式
MapDataset数据集的构建是基于地图数据的采集与处理。首先,通过执行tiles/aerial.py脚本,可在配置的边界框内获取瓦片数据。其次,利用tiles/combiner.py脚本将多个瓦片合并成更大的图像。接着,在QGIS中导入vector/tile_write.py脚本,为每个图像生成标签,这一步骤需要QGIS及地图数据。最后,通过dataset/formatter.py脚本整理图像与标签,形成最终的标准化数据集,并对图像名称进行重命名及随机化处理。
特点
该数据集的特点在于,其以地图为基础,通过瓦片的精确裁剪与合并,形成了可供地理信息系统(GIS)分析的大尺度图像。同时,数据集的构建过程中纳入了地图标签的生成,为后续的机器学习模型训练提供了丰富的地理属性信息。在数据组织上,通过随机化重命名与分类,增强了数据集的泛化能力。
使用方法
使用MapDataset数据集,用户首先需要确保满足依赖条件,包括Numpy库、Python 2.7环境和Requests库。数据集构建完成后,用户可手动创建测试、验证和训练文件夹,以便对数据集进行相应的分割。数据集的图像和标签已预组织,用户可以直接用于模型训练或评估。
背景与挑战
背景概述
MapDataset是一个基于地图数据的专用数据集,旨在为地图信息解析提供标准化的数据支持。该数据集的创建,可追溯至近年来地理信息系统(GIS)与遥感领域的研究需求,由相关研究人员和机构共同开发。其核心研究问题聚焦于如何高效地从地图数据中提取并利用信息,为城市规划、环境监测等领域提供技术支撑,对GIS领域产生了深远的影响。
当前挑战
该数据集在构建过程中面临诸多挑战,主要包括:1)如何精确地获取并处理地图数据,确保其准确性与可靠性;2)在数据集构建过程中,需要克服地图数据量大、处理复杂度高的问题;3)此外,数据集的标注工作需要借助专业软件QGIS,并且对用户的技术要求较高,增加了数据集构建的难度。
常用场景
经典使用场景
在地理信息系统(GIS)领域,MapDataset数据集被广泛应用于地图数据的采集与处理。其经典使用场景在于,研究者通过执行数据集中的脚本,获取特定地理范围内的高分辨率地图瓦片,进而组合这些瓦片以构建更大范围的地图图像,为后续的地图标注和数据分析提供基础素材。
实际应用
在实践应用中,MapDataset数据集可用于城市规划、环境监测、交通流量分析等多个领域。它为决策者提供了精确的地理信息支持,有助于优化城市布局和资源分配,提升城市管理智能化水平。
衍生相关工作
基于MapDataset数据集,研究者们衍生出了一系列相关工作,如地图自动标注算法、地图数据质量评估体系以及地图可视化技术等,这些工作进一步推动了地理信息科学的发展,并为智慧城市建设提供了技术支持。
以上内容由遇见数据集搜集并总结生成



