five

UUKG

收藏
arXiv2023-10-22 更新2024-07-30 收录
下载链接:
https://github.com/usail-hkust/UUKG/
下载链接
链接失效反馈
官方服务:
资源简介:
UUKG是一个统一的城市知识图谱数据集,用于增强城市时空预测的知识。它通过连接行政区、兴趣点、道路段等异构城市实体,构建了数百万个三元组,用于两个大都市的城市知识图谱。

UUKG is a unified urban knowledge graph dataset designed to enhance knowledge for urban spatio-temporal prediction. It constructs millions of triples by linking heterogeneous urban entities such as administrative districts, Points of Interest (POIs), road segments and other similar entities, to establish urban knowledge graphs for two major metropolises.
创建时间:
2023-06-20
搜集汇总
数据集介绍
main_image_url
构建方式
在智慧城市研究领域,UUKG数据集的构建遵循系统化知识抽取与融合原则。该数据集整合了纽约和芝加哥两大都市的异构城市数据源,包括行政分区、道路网络和兴趣点。构建过程首先对原始数据进行预处理与空间对齐,随后定义了八类实体(如行政区、功能区、道路段、交叉口、兴趣点及其类别)和十三类关系(涵盖地理包含、邻接与类别归属)。通过提取数百万条三元组,最终形成了统一的多关系城市知识图谱,并利用Neo4j图数据库进行高效存储与管理,同时采用坐标模糊化处理以保障数据隐私。
特点
UUKG数据集的核心特点在于其统一性与结构复杂性。作为首个面向城市时空预测的开源知识图谱,它突破了以往任务特定图谱的局限,能够兼容多种下游预测任务。图谱中蕴含着丰富的高阶结构模式,如行政层级所体现的树状层次结构,以及地理邻接关系形成的同质与异质循环。定量分析表明,图谱具有零双曲性,适合在双曲空间中嵌入以无损保留层次信息;同时检测到大量循环结构,适宜在球面空间中进行建模。这种多层次、多语义的结构特性为知识表征学习提供了独特挑战与机遇。
使用方法
UUKG数据集的应用主要围绕知识增强的城市时空预测展开。研究者首先可利用结构感知的知识图谱嵌入方法(如双曲空间、球面空间或混合曲率空间模型)学习实体与关系的低维向量表示。这些嵌入能够有效捕获图谱中的层次与循环等高阶结构信息。随后,在具体的时空预测任务中,如出租车服务、自行车出行、人类移动性预测等,通过将学习到的相应实体嵌入(如区域嵌入、道路嵌入、兴趣点嵌入)与观测到的时空特征矩阵进行拼接,从而为预测模型注入先验的城市语义知识。该框架已在多个基准模型与任务上验证了其普遍有效性。
背景与挑战
背景概述
UUKG(统一城市知识图谱)数据集由香港科技大学(广州)与阿里巴巴云智能集团的研究团队于2023年提出,旨在为城市时空预测(USTP)任务提供首个开源、统一的知识图谱基准。该数据集整合了纽约和芝加哥两大都市的异构城市数据,包括行政区划、兴趣点、道路网络等多源实体,构建了包含数百万三元组的城市知识图谱。其核心研究问题在于如何将分散、多粒度的城市数据融合为统一的知识表示,以支持交通流量预测、犯罪事件推断等多种下游任务,从而推动智慧城市中数据驱动的决策分析。UUKG的发布填补了城市计算领域缺乏公开知识图谱数据的空白,为后续研究提供了重要的基础设施。
当前挑战
UUKG面临的挑战主要体现在两个方面:在领域问题层面,城市时空预测任务需同时建模复杂的时空自相关性与高阶语义结构(如层次与循环模式),而传统方法难以有效捕获这些异构知识;在构建过程中,多源城市数据在时空范围与粒度上存在差异,需解决实体对齐与关系定义的统一性问题。此外,图谱中蕴含的层次结构与循环模式要求嵌入方法能够超越欧几里得空间,在双曲或球面等非欧空间中实现精准建模,这对知识表示学习提出了更高要求。
常用场景
经典使用场景
在智慧城市与城市计算领域,UUKG数据集为知识增强的时空预测模型提供了统一且标准化的知识图谱支持。该数据集通过整合行政区域、兴趣点、道路网络等多源异构城市实体,构建了包含数百万三元组的城市知识图谱。其最经典的使用场景在于为各类城市时空预测任务提供可迁移的、结构化的先验知识,研究者能够直接利用图谱中编码的地理包含、邻接关系及类别语义,无需针对特定任务重复构建专用知识库,从而显著提升模型对城市复杂系统的理解能力。
衍生相关工作
UUKG数据集的发布催生了一系列围绕城市知识图谱构建、表示学习与应用拓展的经典研究工作。在知识表示方面,研究重点转向如何利用非欧几何空间(如双曲空间、球面空间及其乘积空间)来更好地建模UUKG中识别出的层次与循环结构,推动了如M2GNN、GIE等混合曲率嵌入模型在城市领域的应用验证。在应用层面,该数据集为后续研究提供了基准测试平台,促进了知识增强的图神经网络、时空注意力机制等模型在城市流量预测、事件检测等任务上的性能比较与创新。此外,它也启发了对多模态城市知识融合、跨城市知识迁移等更广泛议题的探索。
数据集最近研究
最新研究方向
在智慧城市与时空数据智能领域,UUKG数据集的前沿研究聚焦于高阶结构感知的知识图谱嵌入方法及其在多元城市预测任务中的泛化应用。当前研究热点在于利用非欧几里得几何空间(如双曲空间与球面空间)对城市知识图谱中蕴含的层次结构与循环结构进行联合建模,以捕捉城市实体间复杂的空间语义关系。通过构建统一的多源城市知识图谱,研究者能够将行政区域、道路网络、兴趣点等异构实体进行对齐与融合,进而支撑出租车流量、自行车出行、人类移动性、犯罪事件及公共服务请求等五大类时空预测任务。这一方向不仅推动了结构感知嵌入理论在城市计算中的深化,也为知识增强的时空预测模型提供了可复现的基准数据集,显著促进了跨任务知识迁移与模型泛化能力的研究进展。
相关研究论文
  • 1
    UUKG: Unified Urban Knowledge Graph Dataset for Urban Spatiotemporal Prediction · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作