CNSatMap
收藏arXiv2025-04-28 更新2025-04-30 收录
下载链接:
https://github.com/HIT-SIRS/EarthMapper
下载链接
链接失效反馈官方服务:
资源简介:
CNSatMap数据集是一个大规模的卫星图像与地图配对数据集,包含302,132对精确对齐的卫星图像与地图数据,涵盖了38个中国主要城市。卫星图像来自Google Earth,分辨率为0.6米每像素,保留了丰富的地面细节;地图数据来自中国天地图,提供了严格的地图表示。该数据集支持地理空间分析、跨模态图像翻译和城市场景理解等任务,为研究双向卫星图像与地图翻译任务提供了宝贵的资源。
The CNSatMap dataset is a large-scale paired satellite imagery and map dataset, consisting of 302,132 precisely aligned pairs of satellite imagery and map data covering 38 major cities across China. The satellite imagery is sourced from Google Earth, with a resolution of 0.6 meters per pixel and preserves rich ground details; the map data is obtained from Tianditu, providing standardized and rigorous cartographic representations. This dataset supports tasks including geospatial analysis, cross-modal image translation and urban scene understanding, serving as a valuable resource for research on bidirectional satellite imagery and map translation tasks.
提供机构:
哈尔滨工业大学电子与信息工程学院
创建时间:
2025-04-28
原始信息汇总
EarthMapper数据集概述
数据集基本信息
- 名称:EarthMapper/CNSatMap
- 开发团队:哈尔滨工业大学
- 论文发布:2025年4月27日发布于arXiv
数据集核心内容
- 类型:大规模高精度卫星-地图配对数据集
- 数据量:302,132组严格对齐的卫星-地图图像对
- 覆盖范围:中国38个不同城市
主要特点
- 首创性:首个面向双向卫星-地图转换任务的大规模数据集
- 应用方向:
- 卫星到地图的转换
- 地图到卫星的转换
- 图像修补(内外绘制)任务
- 技术支撑:支持地理坐标嵌入和多尺度特征对齐
技术贡献
- 构建CNSatMap基准数据集
- 提出自回归生成框架EarthMapper
- 开发语义注入(SI)机制
- 设计关键点自适应引导(KPAG)方法
可视化示例
- 数据集样本展示:
assets/dataset.png - 地图转卫星结果:
assets/vis_CNSatMap.png - 卫星转地图结果:
assets/vis_NY.png - 修补任务展示:
assets/zero-shot.png
架构示意图
- 模型流程图:
assets/flowchart.svg
搜集汇总
数据集介绍

构建方式
CNSatMap数据集的构建过程体现了严谨的科学方法与高质量的数据标准。研究团队首先从Google Earth获取了0.6米高分辨率的卫星影像,同时采用中国国家地理信息中心维护的天地图矢量地图服务作为制图数据源,确保了数据的现势性和本土化特征。通过Web墨卡托投影(EPSG:3857)进行地理配准后,将影像切割为256×256像素的非重叠图斑,并转换为WGS84坐标系(EPSG:4326)以兼容地理信息系统。经过云层遮挡、建筑倾斜和低多样性区域的严格筛选,最终从60万初始图斑中精选出302,132组精确配对的卫星-地图数据,覆盖中国38个主要城市。
特点
该数据集的核心优势体现在三个方面:地理多样性方面,样本涵盖从沿海超大城市到内陆高原城市的多元地貌,包含不同气候带、人口密度和城市化水平的典型区域;数据质量方面,采用0.6米高分辨率卫星影像与专业矢量地图的精准配准,通过几何校正实现亚像素级对齐;应用价值方面,其大规模高质量配对数据为跨模态地理信息转换研究提供了首个中国城市基准,特别适合城市形态分析、灾害模拟等需要地理真实性的场景。每个样本均附带经纬度元数据,支持空间位置条件的生成任务。
使用方法
使用该数据集时需注意其多尺度特性:基础层面可直接用于监督学习,将配对数据输入EarthMapper等自回归框架进行双向翻译训练;进阶应用可结合地理坐标嵌入实现区域自适应生成,或通过语义注入机制增强特征一致性。对于评估任务,建议采用FID、KID等指标衡量生成图像的视觉真实性,SSIM和PSNR评估结构保真度。数据集的标准256×256尺寸兼容主流视觉架构,其分城市划分的测试集(58,191对)支持区域泛化能力验证。研究人员还可利用其丰富的元数据进行零样本任务拓展,如坐标条件生成或局部修复。
背景与挑战
背景概述
CNSatMap数据集由哈尔滨工业大学的Zhe Dong、Yuzhe Sun等研究人员于2025年创建,旨在推动卫星图像与地图之间的双向转换研究。该数据集包含来自中国38个城市的302,132对精确对齐的卫星-地图图像对,覆盖了多样化的气候、人口密度和城市化水平。作为首个大规模、高精度的双向卫星-地图转换数据集,CNSatMap为城市分析、自动化制图和地理空间特征提取等领域提供了重要支持。其卫星图像来自Google Earth,分辨率为0.6米/像素,地图数据则来自Tianditu服务,确保了数据的时效性和地理特征的精确性。
当前挑战
CNSatMap数据集面临的挑战主要包括两个方面:领域问题的挑战和构建过程中的挑战。在领域问题方面,卫星图像和地图作为两种不同的数据模态,缺乏精确的像素级对齐,这大大增加了转换过程的复杂性;同时,任务要求同时实现地理特征的高级抽象和高质量的视觉合成,进一步提升了技术难度。在构建过程中,数据集需要处理卫星图像中的云层覆盖和大气伪影、非正交成像角度导致的建筑物倾斜,以及地图中结构多样性不足的区域等问题,这些因素都增加了数据清洗和筛选的难度。
常用场景
经典使用场景
CNSatMap数据集作为遥感领域的重要资源,广泛应用于卫星图像与地图之间的双向转换研究。其经典使用场景包括城市规划和灾害响应,通过精确对齐的卫星-地图对,研究人员能够开发高效算法,实现从卫星图像生成抽象地图或从地图重建真实卫星图像。该数据集特别适用于评估生成模型在跨模态转换任务中的性能,为地理空间分析提供可靠基准。
解决学术问题
CNSatMap数据集有效解决了遥感图像与地图间缺乏精确像素对齐的学术难题,为跨模态翻译研究提供了高质量基准。通过提供大规模、高精度的地理对齐数据,该数据集支持对生成模型在语义一致性和结构保真度方面的系统性评估,推动了可控图像生成技术在自动化制图领域的发展。其意义在于填补了地理空间跨模态翻译研究的数据空白,为城市分析和灾害模拟等应用奠定基础。
衍生相关工作
基于CNSatMap数据集,研究者已开发出多项创新工作。EarthMapper框架通过地理坐标嵌入和多重特征对齐技术,实现了高质量的跨模态生成。相关研究还衍生出语义注入机制和关键点自适应引导等创新方法,推动了自回归模型在遥感图像生成领域的应用。这些工作共同构成了地理空间智能生成的技术体系。
以上内容由遇见数据集搜集并总结生成



