Global cities, USA cities
收藏arXiv2025-10-14 更新2025-11-05 收录
下载链接:
https://github.com/andreamusso96/global-city-growth
下载链接
链接失效反馈官方服务:
资源简介:
本文研究了城市在不同时间和空间上的增长模式,突出了城市系统成熟过程中,大城市的增长优势逐渐减弱,并最终转变为更为均衡的增长模式。论文中介绍了两个数据集:'全球城市'和'美国城市',分别使用卫星图像和人口普查微观数据来跟踪城市人口。'全球城市'数据集涵盖了1975年至2025年间全球99个国家的城市人口数据,而'美国城市'数据集则涵盖了1850年至2020年间美国大陆的城市人口数据。这两个数据集为研究城市增长趋势提供了宝贵的时空覆盖范围,有助于解释城市规模增长的优势和城市化进程对城市集中度的影响。
This paper investigates urban growth patterns across temporal and spatial dimensions, highlighting that as urban systems mature, the growth advantages of large cities gradually wane and ultimately shift toward a more balanced growth paradigm. Two datasets are presented in this study: "Global Cities" and "US Cities", which employ satellite imagery and census microdata respectively to track urban population. The "Global Cities" dataset encompasses urban population data from 99 countries globally over the period 1975 to 2025, whereas the "US Cities" dataset covers urban population data for the continental United States spanning from 1850 to 2020. These two datasets offer valuable spatiotemporal coverage for research on urban growth trends, enabling the interpretation of growth advantages associated with city size and the impacts of urbanization on urban concentration.
提供机构:
ETH Zurich, Switzerland, Complexity Science Hub Vienna, Austria, Leibniz Institute of Ecological Urban and Regional Development, Dresden
创建时间:
2025-10-14
搜集汇总
数据集介绍

构建方式
在城市化进程研究中,构建具有时空一致性的城市数据集是理解全球城市动态的基础。Global cities数据集基于全球人类住区层(GHSL)2023数据包,通过卫星影像与人口普查数据融合,生成1公里网格单元的人口与建成区估算。USA cities数据集则利用IPUMS美国人口普查微观数据与历史地理信息,通过空间卷积核重构1850-2020年的人口分布网格。两个数据集均采用城市聚类算法,以连续建成区或高密度区域作为城市边界定义,通过二分图匹配跨时期集群,确保城市定义的时空可比性。该算法动态调整城市边界,并采用稳定阈值过滤人口低于5000的聚落,有效规避了分类偏差与新生集群选择偏误。
特点
该数据集的核心特征在于其前所未有的时空覆盖广度与方法论严谨性。Global cities数据集涵盖99个国家、160万座城市在1975-2025年间的动态数据,覆盖全球94%人口;USA cities数据集则提供美国1850-2020年间2.7万座城市的历史演变轨迹。数据构建采用统一的地理空间标准,突破传统行政边界的局限,通过非参数化的惩罚三次B样条拟合城市规模-增长关系,精准捕捉非线性动态。特别值得关注的是,数据集揭示了城市增长的生命周期规律:城市化初期大城市呈现显著增长优势,随着系统成熟该优势逐渐衰减,这一发现为调和比例增长理论与规模收益递增理论提供了实证基础。
使用方法
该数据集为城市系统演化研究提供了多尺度分析框架。研究者可通过城市规模-增长斜率量化大城市的增长优势,利用秩-规模斜率测度人口集中程度。在应用层面,可结合 urbanization 投影数据,通过理论模型推导未来50年城市集中度演变趋势。数据管道采用容器化架构,支持从原始栅格数据到城市边界矢量、人口增长计算的全流程复现。用户可通过Zenodo获取聚合数据,或使用GitHub开源代码库重构分析流程,其中全球城市数据需遵循GHSL使用规范,美国历史数据调用IPUMS API需申请授权密钥。这种设计既保障了研究的可重复性,也为跨学科城市研究提供了标准化基础设施。
背景与挑战
背景概述
城市化研究历来关注城市规模分布与增长动态的演化规律。由苏黎世联邦理工学院与维也纳复杂性科学中心等机构研究人员于2025年构建的Global cities与USA cities数据集,通过融合卫星遥感与历史人口普查数据,首次实现了全球99国(1975-2025)与美国本土(1850-2020)城市人口的时空一致性测度。该数据集突破传统行政边界的局限,采用地理聚类算法动态界定城市实体,为验证城市增长理论提供了跨世纪、跨大陆的实证基础。其核心价值在于揭示了城市增长存在生命周期规律:城市化初期大城市凭借规模效益实现超速增长,而成熟期则趋向均衡发展,这一发现重塑了学界对城市系统演化路径的认知。
当前挑战
该数据集致力于解决城市增长理论中长期存在的理论分歧——规模收益递增与比例增长假说的对立统一问题。在构建过程中面临三重挑战:其一是数据异构性难题,19世纪美国手写普查记录存在行政区划断层与人口统计矛盾,需通过个体迁移数据重构历史人口网格;其二是遥感数据偏差修正,全球人居层网格对农村人口存在系统性低估,需开发空间卷积算法进行密度校准;其三是方法论创新需求,传统线性模型无法捕捉复杂的规模-增长非线性关系,需引入惩罚样条拟合技术实现跨国家、跨时期的稳健比较。
常用场景
经典使用场景
在城市研究领域,该数据集通过统一的地理定义和跨时空可比性,为分析城市增长模式提供了标准化框架。其最经典的应用场景在于验证城市增长的生命周期理论,即通过比较不同规模城市在城市化各阶段的增长率差异,揭示大型城市增长优势随城市化进程演变的动态规律。
衍生相关工作
该数据集催生了城市动态研究的新范式,启发了对城市规模分布形成机制的深入探索。基于其构建的城市聚类算法和增长模型,后续研究扩展到城市网络分析、创新扩散模拟等领域,特别是推动了将地理信息系统与复杂系统理论相结合的城市演化研究,为智慧城市和可持续发展目标提供了方法论基础。
数据集最近研究
最新研究方向
在城市化研究领域,基于卫星遥感和人口普查微观数据构建的全球城市数据集揭示了城市增长的生命周期规律。当前研究聚焦于大型城市增长优势随城市化进程演变的动态机制,通过跨洲际比较发现亚洲与非洲早期城市化阶段存在显著的大城市增长溢价,而欧美成熟城市体系则呈现增长趋同。这一发现调和了规模收益递增理论与比例增长理论的对立观点,为预测未来50年人口集中趋势提供了统一框架。研究进一步指出,随着全球城市化水平提升,大城市人口集聚速度将显著放缓,这对区域经济集聚效应和可持续发展政策具有重要启示意义。
相关研究论文
- 1通过ETH Zurich, Switzerland, Complexity Science Hub Vienna, Austria, Leibniz Institute of Ecological Urban and Regional Development, Dresden · 2025年
以上内容由遇见数据集搜集并总结生成



