five

CityNet

收藏
arXiv2024-04-10 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2106.15802v2
下载链接
链接失效反馈
官方服务:
资源简介:
CityNet是一个综合多模态城市数据集,用于高级城市计算研究。该数据集包含来自七个城市的多种数据,如出租车轨迹、交通速度、兴趣点(POI)、道路网络、风速、降雨、温度等,并被分类为移动数据、地理数据和气象数据三大类。CityNet的创建旨在解决城市数据复杂性问题,通过提供全面和多方面的数据支持,促进城市计算领域的广泛研究。数据集的应用领域包括时空预测、迁移学习和强化学习等,旨在通过这些任务提高城市系统的智能化决策能力。

CityNet is a comprehensive multi-modal urban dataset designed for advanced urban computing research. This dataset contains diverse data from seven cities, including taxi trajectories, traffic speeds, Points of Interest (POI), road networks, wind speeds, rainfall, temperatures, and more, and is categorized into three major types: mobile data, geospatial data, and meteorological data. CityNet was developed to address the complexity of urban data, and to facilitate extensive research in the urban computing domain through comprehensive and multi-faceted data support. The application scenarios of this dataset include spatiotemporal prediction, transfer learning, reinforcement learning, and other fields, aiming to enhance the intelligent decision-making capabilities of urban systems via such tasks.
提供机构:
香港科技大学
创建时间:
2021-06-30
搜集汇总
数据集介绍
main_image_url
构建方式
在智慧城市研究领域,数据碎片化与模态单一长期制约着综合性分析。CityNet的构建过程系统整合了七座城市的多源异构数据,涵盖出租车轨迹、交通速度、兴趣点、路网及气象信息。原始数据经过严格的时空对齐预处理,统一地理坐标范围与采样间隔,并转化为区域化时空张量。具体而言,出租车GPS轨迹被处理为流入流出量、接客量与空驶时间;兴趣点数据按类别聚合为空间分布张量;气象数据则编码为多维特征向量。这种精细化的处理流程确保了多模态数据在统一时空框架下的可融合性与一致性。
特点
CityNet的突出特点在于其多维度的综合性与内在关联性。数据集不仅涵盖移动性、地理与气象三大类数据,更通过服务数据与上下文数据的分类,揭示了城市服务状态与环境因素间的复杂相互作用。其时空对齐特性使得跨城市与跨任务的对比分析成为可能,而子数据集间的高度相关性为知识迁移提供了坚实基础。数据集的另一显著特征是城市规模的多样性,既包含北京、上海等大型城市,也涵盖西安、成都等区域结构紧凑的城市,为不同空间尺度下的算法验证提供了丰富场景。
使用方法
该数据集为城市计算研究提供了多任务验证平台。在时空预测方面,研究者可利用其进行交通流量、需求供给等任务的基准测试,支持卷积网络、图神经网络等多种模型对比。迁移学习应用可通过跨城市知识传递缓解数据稀缺问题,例如将北京训练的模型适配至深圳。强化学习任务则可基于历史请求数据构建出租车调度仿真环境,评估不同策略的长期收益。使用时应遵循数据集的时空划分规范,注意不同城市的数据可用性差异,并可结合其提供的基准结果进行算法性能评估与改进。
背景与挑战
背景概述
随着数据驱动方法在城市计算领域的兴起,对综合性多模态数据集的需求日益凸显。CityNet数据集由香港科技大学郑正飞、耿旭和杨海教授团队于2024年正式发布,旨在解决城市数据因来源分散、时空未对齐而难以整合的瓶颈问题。该数据集汇聚了北京、上海、深圳等七座城市的出租车轨迹、交通速度、兴趣点、路网及气象等多源数据,并将其系统性地划分为移动性、地理与气象三大类数据流。CityNet的构建不仅填补了现有城市数据集中多模态信息缺失的空白,更为时空预测、迁移学习与强化学习等前沿研究提供了统一的基准平台,对推动智慧城市系统的跨域协同分析与决策优化具有里程碑意义。
当前挑战
CityNet所应对的核心领域挑战在于如何通过多模态数据融合提升城市复杂系统的建模与预测精度,例如在交通流量预测中需同时考量移动模式、地理环境与气象因素的动态耦合效应。在数据集构建过程中,研究团队面临两大主要挑战:其一,城市数据通常分散于政府机构与企业等不同实体,其在时空覆盖范围、数据粒度与属性定义上存在显著差异,导致多源数据的标准化对齐与整合极为困难;其二,超越数据采集层面,识别不同子数据集之间的内在关联性至关重要,例如出租车需求与兴趣点分布、交通速度与天气条件之间的隐含依赖关系,这类关联的挖掘是提升模型跨任务知识迁移能力的关键,但需克服数据稀疏性、异质性及隐私保护等多重障碍。
常用场景
经典使用场景
在智慧城市研究领域,CityNet数据集为多模态城市数据分析提供了经典范例。该数据集整合了出租车轨迹、交通速度、兴趣点、路网及气象等多源异构数据,覆盖七个主要城市,形成了时空对齐的统一框架。其最典型的应用场景在于支持复杂的时空预测任务,例如基于历史出行模式预测区域级出租车流入流出量,或结合气象条件分析交通速度变化趋势。通过融合移动性、地理和气象三类数据流,研究者能够构建更精准的城市动态模型,揭示人类活动与城市环境之间的深层关联。
衍生相关工作
CityNet催生了系列城市计算领域的创新研究。基于其多模态特性,研究者开发了面向时空图神经网络的跨城市迁移学习框架,如利用POI相似性进行区域匹配的RegionTrans方法。数据集支撑的图卷积网络与注意力机制对比实验,揭示了城市规模对图模型效用的调节作用。在强化学习方向,衍生了结合长期收益优化的LPA调度算法,显著提升出租车系统累计收益。这些工作不仅验证了多源数据融合的价值,更推动了元学习、联邦学习等前沿范式在城市计算场景的落地探索。
数据集最近研究
最新研究方向
随着智慧城市研究的深入,多模态数据集在时空预测与跨域知识迁移中展现出关键价值。CityNet作为首个整合多城市、多任务数据的综合性数据集,其前沿研究聚焦于时空图神经网络与联邦学习的融合应用。近期热点探索包括利用图注意力网络捕捉城市区域间的动态关联,以及通过跨城市迁移学习缓解数据稀缺问题,这些研究不仅提升了交通流量与需求预测的精度,还为隐私保护下的多源数据协同分析提供了新范式。该数据集推动了城市计算领域向更智能、更高效的决策系统演进,对构建可持续的智慧城市生态具有深远意义。
相关研究论文
  • 1
    CityNet: A Comprehensive Multi-Modal Urban Dataset for Advanced Research in Urban Computing香港科技大学 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作