five

中国建筑楼面面积数据集

收藏
arXiv2023-06-07 更新2024-06-21 收录
下载链接:
https://gitlab.ethz.ch/raox/urban-satellite-public-v2
下载链接
链接失效反馈
官方服务:
资源简介:
中国建筑楼面面积数据集是由苏黎世联邦理工学院应用经济学系的研究团队开发,专注于测量中国40个主要城市的建筑楼面面积。数据集利用Sentinel-1和Sentinel-2卫星图像,通过多任务对象分割器方法,同时学习建筑足迹和高度。该数据集旨在最大化城市覆盖范围,并最终提供纵向数据,以支持城市发展研究。数据集的应用领域包括城市规划、经济学和地理信息系统,旨在解决城市发展和建筑空间利用的问题。

The Building Floor Area Dataset of China was developed by a research team from the Department of Applied Economics at ETH Zurich. It focuses on measuring the building floor area of 40 major cities across China. The dataset leverages Sentinel-1 and Sentinel-2 satellite imagery, adopting a multi-task object segmentation approach to simultaneously learn building footprints and heights. This dataset aims to maximize urban coverage and ultimately provide longitudinal data to support urban development research. Its application domains include urban planning, economics, and geographic information systems, and it is designed to address issues related to urban development and built space utilization.
提供机构:
苏黎世联邦理工学院应用经济学系
创建时间:
2023-03-04
搜集汇总
数据集介绍
main_image_url
构建方式
在城市发展与遥感技术交叉领域,高精度建筑楼面数据的匮乏长期制约着宏观与中观尺度的城市研究。为填补这一空白,该数据集基于Sentinel-1合成孔径雷达与Sentinel-2多光谱光学卫星影像,覆盖中国40个人口密集且基础设施快速变迁的城市。研究团队采用多任务学习框架,以U-Net为骨干网络(优选ResNet-34),在同一模型中并行学习建筑足迹分割与高度回归:足迹任务通过交叉熵损失识别建筑覆盖区域,高度任务则利用平滑L1损失预测归一化后的建筑高度。数据经Google Earth Engine预处理后,被切割为256×256像素的瓦片,并以90%与10%的比例划分训练集与验证集,深圳市数据作为独立测试集。
使用方法
数据集的使用遵循标准化流程,研究人员可通过公开的GitLab仓库获取预处理后的影像瓦片、训练好的模型权重及完整的推理管线。使用时,用户可加载预训练的U-Net模型,对任意Sentinel-1与Sentinel-2影像叠加区域进行推理,输出逐像素的建筑足迹二值图与高度连续值。推荐在200米以上的聚合网格层级上进行统计分析,以平衡预测精度与空间细节。数据支持与人口普查、经济普查或基础设施规划数据的空间关联分析,亦可结合夜间灯光数据构建多源城市密度指标,适用于城市扩张监测、土地利用效率评估及聚落形态学等研究场景。
背景与挑战
背景概述
中国建筑楼面面积数据集由苏黎世联邦理工学院的应用经济学讲席教授Peter Egger、Susie Xi Rao及Sebastiano Papini等人于2023年创建,旨在填补社会科学领域对大规模、长时序、高质量城市建筑空间数据的需求空白。该数据集聚焦于中国40个主要城市的建筑占地面积与高度,利用Sentinel-1和Sentinel-2卫星影像,通过多任务学习框架同步提取建筑足迹与高度信息,为宏观、中观及微观尺度的城市集聚效应、资源利用和基础设施效益研究提供了前所未有的数据基础。其开放获取特性(代码与数据公开于GitLab)推动了城市经济学、遥感与计算机视觉交叉领域的实证研究,尤其为发展中国家快速城市化进程中的空间结构量化分析奠定了关键里程碑。
当前挑战
该数据集面临的挑战主要体现在三个方面:其一,高分辨率卫星影像与可靠参考数据的稀缺性,现有开源数据仅覆盖部分城市子区域,且需大量预处理步骤以消除云层遮挡、传感器差异等噪声,直接影响模型检测精度与泛化能力。其二,联合学习建筑足迹与高度的技术复杂性,多任务学习框架虽能并行优化两类目标,但如何平衡分割与回归任务的权重、避免梯度冲突,以及应对Sentinel影像10米分辨率下密集建筑群(如深圳超90%建筑间距小于10米)的边界模糊问题,仍是关键瓶颈。其三,预测质量的评估与验证困境,单一指标易产生误导,需融合人口密度、夜间灯光等多源数据构建综合验证体系;同时,参考数据本身存在标注遗漏(如未完工建筑)与时空不一致,进一步加剧了模型性能的可靠评估难度。
常用场景
经典使用场景
在城市化与遥感监测的交汇领域,中国建筑楼面面积数据集为城市空间形态的量化研究提供了前所未有的数据支撑。该数据集基于Sentinel-1与Sentinel-2卫星影像,采用多任务深度学习框架同步提取建筑占地面积与高度,覆盖中国40个主要城市。其经典使用场景聚焦于城市扩张的时空动态监测,通过解析建筑楼面面积的分布格局,研究者得以精准刻画城市集聚的微观结构,识别多中心与单中心城市的形态差异,并追踪城市核心区的历史迁移轨迹,为城市地理学与区域经济学提供了高分辨率的实证基础。
解决学术问题
该数据集有效破解了社会科学领域中长期存在的宏观与中观尺度高质量数据匮乏的困境。传统研究依赖夜间灯光或稀疏的普查数据,难以精确衡量城市内部建筑密度的异质性。该数据集的问世,使得学者能够从建筑楼面面积这一核心指标出发,深入探讨城市化进程中的人口集聚效应、基础设施投资的经济回报以及土地利用效率的演化规律。其开放获取特性更是推动了跨学科研究范式的革新,显著提升了城市发展因果推断的可靠性与精细化水平。
实际应用
在实际应用层面,该数据集为城市规划与管理决策提供了可操作的量化工具。通过集成建筑楼面面积与夜间灯光等多源数据,城市管理者能够识别高密度建成区与低效利用地块,优化土地资源配置与公共交通网络布局。房地产行业可借助该数据评估区域开发潜力,预测住房供需失衡风险。此外,应急管理部门可利用建筑高度与分布信息,在灾害模拟中更准确地评估人员疏散路径与救援资源调配,显著提升城市韧性治理的科学性。
数据集最近研究
最新研究方向
中国建筑楼面面积数据集的最新研究方向聚焦于利用多任务深度学习框架,从开放获取的中分辨率哨兵卫星影像中联合提取建筑足迹与高度,以弥补传统社会经济数据在空间与时间覆盖上的不足。该研究将计算机视觉与遥感技术深度融合,通过U-Net架构实现建筑三维结构的规模化估算,并创新性地引入夜间灯光数据作为外部验证指标,揭示城市聚落形态与经济活动之间的内在关联。这一方向不仅为量化中国快速城市化进程中的建筑密度演变提供了标准化工具,更推动了城市经济学、人口地理学等领域在微观空间尺度上的实证分析,尤其为评估基础设施投资效应、理解多中心城市结构等前沿议题开辟了数据驱动的新路径。
相关研究论文
  • 1
    Building Floorspace in China: A Dataset and Learning Pipeline苏黎世联邦理工学院应用经济学系 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作