WorldCommuting-OD
收藏arXiv2025-05-21 更新2025-05-27 收录
下载链接:
https://github.com/tsinghua-fib-lab/WorldCommuting-OD
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为WorldCommuting-OD,由清华大学的研究团队创建,包含全球6大洲、179个国家、1625个城市的通勤OD流数据。数据集基于人口统计、卫星影像和兴趣点(POI)等多源数据进行构建,通过深度生成模型生成通勤OD流,旨在为城市科学、数据科学、交通工程等领域的研究提供支持。
This dataset, named WorldCommuting-OD, was created by a research team from Tsinghua University. It contains commuting Origin-Destination (OD) flow data covering 6 continents, 179 countries and 1625 cities across the globe. The dataset is constructed using multi-source data including demographic statistics, satellite imagery and Points of Interest (POI), and the commuting OD flows are generated via deep generative models. It aims to support research in fields such as urban science, data science and transportation engineering.
提供机构:
清华大学
创建时间:
2025-05-21
搜集汇总
数据集介绍

构建方式
WorldCommuting-OD数据集的构建采用了多源全球公开数据与深度图生成模型相结合的创新方法。研究团队首先整合了Who's On First和GUI数据集,确定了全球6大洲179个国家的1,625个城市边界,并采用自适应网格法将每个城市划分为功能区域。随后通过融合WorldPop的人口统计数据、Esri World Imagery的卫星影像以及OpenStreetMap的兴趣点数据,构建了包含1,094维特征的区域语义表征。最后运用基于图扩散的WEDAN模型,以前向扩散和反向去噪的迭代过程生成区域间通勤OD流,其空间分布与真实观测数据具有高度一致性(CPC=0.572)。
使用方法
数据集以标准化格式提供城市边界Shapefile和OD流矩阵,支持多学科研究应用。在技术实现上,建议使用GeoPandas加载城市区域划分数据,NumPy处理OD流矩阵,ArcGIS进行空间可视化分析。数据集特别适用于五大可持续发展目标研究:通过OD流空间模式识别低效通勤以优化城市规划(SDG-11);基于网络连通性分析评估城市韧性(SDGs-9,11);作为交通需求建模基础数据支持绿色出行(SDG-9);追踪高风险传播路径辅助公共卫生决策(SDG-3);结合出行距离和交通方式估算碳排放(SDGs-7,13)。为提升易用性,团队同步提供了无需编程的Web可视化平台和Python示例代码库。
背景与挑战
背景概述
WorldCommuting-OD数据集由清华大学电子工程系和北京信息科学与技术国家研究中心的Can Rong、Jingtao Ding、Meng Li和Yong Li等研究人员于2025年发布,旨在解决全球城市可持续发展研究中的关键问题。该数据集覆盖了全球6大洲、179个国家和1,625个城市,通过整合精细的人口统计数据、卫星影像和兴趣点(POIs)等多源公开数据,利用深度生成模型构建了城市区域间的通勤起点-终点(OD)流数据。其核心研究问题聚焦于如何在大规模、多样化的城市环境中准确表征人类移动模式,从而为城市规划、交通工程、公共健康和环境保护等领域的可持续发展政策提供数据支持。该数据集填补了全球范围内通勤OD流数据缺失的空白,推动了城市科学、数据科学和交通工程等跨学科研究的进展。
当前挑战
WorldCommuting-OD数据集面临的主要挑战包括两个方面:领域问题挑战和构建过程挑战。在领域问题方面,通勤OD流数据的获取长期依赖耗时耗力的传统人口普查或存在商业冲突与隐私风险的手机定位数据,导致全球覆盖性和数据一致性不足,制约了城市动态研究的普适性结论。在构建过程中,研究人员需解决多源异构数据(如卫星影像语义特征提取、POI功能表征)的融合难题,并设计能够捕捉城市地理特征与人类移动复杂关系的生成模型。此外,模型需在跨大陆、跨文化城市的异质性环境中保持生成结果的准确性,其验证工作涉及与手机定位数据、人口普查数据的多维度比对,以及下游任务(如碳排放预测)的性能评估,这对算法的鲁棒性和泛化能力提出了极高要求。
常用场景
经典使用场景
WorldCommuting-OD数据集在全球城市可持续发展和交通规划研究中具有经典应用价值。该数据集通过捕捉城市居民从居住地到工作地的通勤流动模式,为理解城市动态提供了关键数据支持。其覆盖6大洲179个国家的1625个城市,为跨文化、跨地域的对比研究提供了前所未有的机会。数据集采用深度生成模型,融合人口统计、卫星影像和兴趣点等多源数据,生成的OD流与真实观测数据高度吻合,使其成为研究城市空间结构、通勤网络特性的理想选择。
解决学术问题
该数据集有效解决了城市科学领域多个关键学术问题。首先,它克服了传统通勤数据获取成本高、覆盖范围有限的问题,通过生成模型实现了全球尺度的高质量OD数据生产。其次,数据集支持对城市功能区划效率的量化评估,为验证'低效通勤'理论提供了实证基础。再者,其多城市覆盖特性使得研究者能够探索不同发展阶段、不同文化背景下城市通勤模式的共性与差异,推动了城市动态普适性理论的发展。最后,数据集的技术验证框架为生成式城市数据的质量评估设立了新标准。
实际应用
在实际应用层面,WorldCommuting-OD数据集为城市规划决策提供了重要依据。交通工程师利用OD流进行交通需求建模,优化基础设施布局以缓解拥堵;公共卫生部门通过分析通勤网络识别疾病传播高风险路径;能源规划者则依据通勤走廊特征部署清洁交通系统。数据集还支持联合国可持续发展目标(SDGs)的实现,如在SDG-11(可持续城市)方面帮助评估区域功能匹配度,在SDG-13(气候行动)方面辅助计算交通碳排放。其网页交互界面进一步降低了非技术用户的使用门槛。
数据集最近研究
最新研究方向
近年来,WorldCommuting-OD数据集在城市可持续发展领域引起了广泛关注。该数据集通过整合全球多源公开数据,利用深度图生成模型生成了覆盖6大洲、179个国家、1625个城市的通勤起点-终点(OD)流数据,填补了全球范围内城市通勤动态数据的空白。研究热点主要集中在以下几个方面:首先,该数据集为城市规划和交通工程提供了重要支持,通过分析通勤OD流,可以优化城市功能区划和交通网络设计,减少长距离通勤带来的能源消耗和碳排放。其次,在公共健康领域,通勤OD流数据被用于模拟流行病传播路径,为疫情控制策略提供科学依据。此外,该数据集还支持城市韧性评估,通过分析通勤网络的关键节点和脆弱区域,帮助城市制定针对性的抗灾策略。在环境可持续性方面,通勤OD流数据被用于估算城市交通碳排放,为低碳城市发展提供数据支持。该数据集的推出,不仅推动了城市科学、数据科学和交通工程的跨学科研究,还为联合国可持续发展目标(SDGs)的实现提供了重要工具。
相关研究论文
- 1A Global Commuting Origin-Destination Flow Dataset for Urban Sustainable Development清华大学 · 2025年
以上内容由遇见数据集搜集并总结生成



