five

Scan Histo Urban Footprints Dataset

收藏
arXiv2025-10-02 更新2025-10-04 收录
下载链接:
https://geoservices.ign.fr/scanhisto#telecharge- mentscan501950
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“Scan Histo Urban Footprints Dataset”,由法国国家地理和森林信息研究所(IGN)提供,包含了1925年至1950年间法国全国范围内的高分辨率地形图,通过深度学习技术从中提取了城市区域,形成了首个开放获取的国家级城市足迹数据集。数据集覆盖了法国全境(不包括海外部门和科西嘉岛),总计941个高分辨率图块,提供了城市区域和背景区域的二值化掩模,可用于长期城市化模式的分析和研究。

The dataset named "Scan Histo Urban Footprints Dataset" is provided by the French National Institute of Geographic and Forest Information (IGN). It contains high-resolution topographic maps spanning from 1925 to 1950 across the entire territory of France (excluding overseas departments and Corsica). Urban areas were extracted from these maps using deep learning techniques, forming the first open-access national-scale urban footprints dataset. Comprising a total of 941 high-resolution map tiles, the dataset provides binary masks for both urban and background regions, which can be utilized for the analysis and research of long-term urbanization patterns.
提供机构:
CY Cergy Paris Université/PLACES Lab, France; University of Montpellier 3/LAGAM Lab, France; University of Rouen/UMR IDEES Lab, France
创建时间:
2025-10-02
搜集汇总
数据集介绍
main_image_url
构建方式
在历史地理信息数字化研究领域,Scan Histo Urban Footprints Dataset通过创新性的双通道U-Net架构构建而成。该方法首先利用58组图像-标注对进行初步预测,生成覆盖法国全境的初始城市足迹栅格图,并识别出文本、道路等高混淆区域;随后基于目标采样策略将数据集扩展至312组样本,结合第一轮输出的二值化结果进行第二轮训练,有效降低了放射测量噪声干扰。整个流程依托高性能计算集群对941幅高分辨率历史地图瓦片进行分布式处理,最终形成具有73%整体精度的全国尺度城市足迹数据集。
特点
该数据集的核心价值体现在其对20世纪中期法国城市形态的多维度刻画。数据源采用1925-1950年间法国国家地理与森林信息院制作的Scan Histo历史地图系列,以5米分辨率完整保留中心城区纹理化街区与郊区实心像素的差异化表达。其独特优势在于通过深度学习模型克服了历史地图固有的异质性挑战,包括不同制图员导致的色调差异、墨水退化现象以及等高线、文字标注等干扰要素,成功实现了巴黎大区红色区块与外省黑白区块的跨区域统一识别。
使用方法
该数据集为城市历史演变研究提供了标准化分析框架。研究人员可直接通过Nakala数据仓库获取矢量化的城市足迹数据,配合GitHub开源的PyTorch处理流程进行定制化分析。实际应用时建议采用两阶段验证策略:首先利用预留的20%样本集进行像素级精度评估,再通过重采样至100米分辨率与GHSL等现代城市数据集进行时空对比。对于特定区域研究,可调用预训练模型对局部历史地图实施迁移学习,其模块化设计支持扩展至19世纪Etat-Major地图系列的处理。
背景与挑战
背景概述
历史城市扩张的定量分析在法国1970年代前因缺乏全国性数字城市足迹数据而长期受阻。Scan Histo Urban Footprints Dataset由法国国家地理与森林信息研究所(IGN)主导,基于1925-1950年间制作的Scan Histo历史地图系列,通过双通道U-Net深度学习框架构建,填补了卫星时代前城市形态数据的空白。该数据集首次实现了法国全境尺度城市足迹的数字化重建,为研究二战前后城市重建、汽车普及等关键历史阶段的城镇化动态提供了重要数据基础,推动了历史地理学与计算社会科学的交叉融合。
当前挑战
该数据集需应对历史地图固有的复杂性挑战:在领域层面,需解决高异质性城市肌理与密集符号(如等高线、文字标注)导致的误分类问题,其语义分割精度受制于地图保存状态与制图风格差异;在构建过程中,面临扫描地图的辐射度噪声、多源制图人员导致的色调不均,以及全国尺度941个高分辨率图块的分布式计算难题。双通道训练策略虽通过针对性数据增强抑制了道路与文本干扰,但乡村地区纹理混淆与局部过拟合现象仍制约着模型泛化能力。
常用场景
经典使用场景
在历史地理学和城市演化的研究中,Scan Histo Urban Footprints Dataset为分析20世纪中期法国城市化进程提供了关键数据支撑。该数据集通过深度学习技术从1925-1950年的历史地图中提取城市边界,成为研究前卫星时代城市扩张模式的基准数据。其典型应用场景包括量化城市形态变迁、识别二战前后建成区空间分布规律,以及对比不同区域城市化速率的时空异质性。
实际应用
该数据集的实际价值体现在多学科交叉研究中。城市规划部门可借助其分析历史城市结构对当代空间格局的遗传影响,环境科学家能结合现代遥感数据构建跨世纪的土地利用变化序列。例如通过与全球人类住区层(GHSL)数据的融合,可清晰呈现巴黎大都市区等典型区域的扩张轨迹,为国土空间规划和遗产保护提供历史维度参照。
衍生相关工作
基于该数据集的开源特性,衍生出多项城市历史地理学创新研究。后续工作扩展了深度学习模型在拿破仑地籍图、18世纪卡西尼地图等更早期史料中的应用,推动了历史地图矢量化方法论的演进。其提供的训练数据集和预训练模型已成为开发跨时期城市足迹提取流程的重要基石,促进了历史地理信息系统的标准化建设。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作