Urban Datasets
收藏github2020-06-27 更新2024-05-31 收录
下载链接:
https://github.com/tommantonela/urban_datasets
下载链接
链接失效反馈官方服务:
资源简介:
包含多个城市数据集,如交通、垃圾、政府、犯罪、出租车、自行车等数据,以及空气质量、天气、人群流动等详细数据。
This dataset encompasses a variety of urban data, including traffic, waste management, government operations, crime statistics, taxi services, and bicycle usage, along with detailed information on air quality, weather conditions, and human mobility patterns.
创建时间:
2019-09-10
原始信息汇总
数据集概述
1. 布宜诺斯艾利斯数据集
- 内容: 包含交通、垃圾、政府、犯罪、出租车、自行车等多方面数据。
- 来源: 布宜诺斯艾利斯政府数据集
2. 纽约市开放数据
- 内容: 提供纽约市的开放数据。
- 来源: 纽约市开放数据
3. 芝加哥开放数据
- 内容: 提供芝加哥市的开放数据。
- 来源: 芝加哥市开放数据
4. GeoLife轨迹数据集
- 内容: 由微软亚洲研究院收集的GPS轨迹数据,涉及167名用户,时间跨度超过两年。
- 用途: 适用于移动模式挖掘、用户活动识别、基于位置的社交网络、位置隐私和位置推荐等研究。
- 来源: GeoLife GPS轨迹数据集用户指南
5. Foursquare签到数据
- 内容: 包含每个签到的场地ID、场地类别、时间戳和用户ID。
- 来源: Foursquare签到数据
6. 北京和上海空气质量数据
- 内容: 包含2013年2月8日至2014年2月8日期间,北京和上海空气质量监测站的数据。
- 来源: U-Air: 当城市空气质量推断遇到大数据
7. 道路段交通和地理特征数据
- 内容: 包含从出租车GPS轨迹、道路网络、北京POI和道路视频片段中提取的六部分数据。
- 来源: 交通和地理特征数据
8. 纽约市噪音投诉和地理数据
- 内容: 包含三部分数据:311城市噪音投诉张量、纽约市各区域地理特征、纽约市36个地点的实际噪音水平。
- 来源: 诊断纽约市噪音
9. 中国43个城市空气质量、气象数据和天气预报
- 内容: 用于空气质量预报和实时推断,也可用于测试跨领域数据融合方法。
- 来源: 空气质量、气象数据和天气预报数据集
10. 自行车共享数据与天气条件
- 内容: 包含纽约和芝加哥自行车共享站的自行车使用情况(通过检查和检查次数表示),以及收集自行车共享数据期间的天气条件数据。
- 来源: 自行车共享系统中的交通预测
11. 集体异常检测数据集
- 内容: 包含五个部分的数据,包括纽约市的出租车行程数据、自行车共享数据、311数据、POI和道路网络数据。
- 来源: 跨多个时空数据集检测集体异常
12. 城市各区域人群流入流出数据
- 内容: 包含两种人群流动数据:北京五年出租车流动和纽约市自行车共享系统自行车使用情况。
- 来源: 城市范围内人群流动预测的深度时空残差网络
搜集汇总
数据集介绍

构建方式
Urban Datasets的构建方式主要依赖于多个城市的公开数据源和科研机构的数据收集。数据集涵盖了来自布宜诺斯艾利斯、纽约、芝加哥等城市的交通、垃圾处理、政府数据、犯罪记录、出租车轨迹、自行车共享系统等多种类型的数据。此外,微软亚洲研究院的GeoLife轨迹数据集和Foursquare的签到数据也被纳入其中,进一步丰富了数据集的多样性和覆盖范围。这些数据通过开放数据平台和科研合作项目获取,确保了数据的权威性和时效性。
使用方法
Urban Datasets的使用方法灵活多样,适用于多种研究场景。研究者可以通过访问提供的链接下载所需数据,并根据研究目标进行数据预处理和分析。例如,GeoLife轨迹数据集可用于用户行为分析和位置推荐,而自行车共享数据则可用于交通流量预测和城市交通规划。数据集还支持跨领域数据融合研究,如将空气质量数据与气象数据结合,进行空气质量预测。使用数据集时,建议引用相关文献以确保学术规范。
背景与挑战
背景概述
Urban Datasets 是一个多源城市数据集,涵盖了交通、环境、公共服务等多个领域的数据。该数据集由多个研究机构和政府部门共同构建,主要数据来源包括布宜诺斯艾利斯、纽约、芝加哥等城市的开放数据平台,以及微软亚洲研究院的GeoLife轨迹数据集。数据集的核心研究问题聚焦于城市数据的融合与分析,旨在通过多源数据的整合,揭示城市运行中的复杂模式与规律。自2007年以来,该数据集在移动模式挖掘、用户活动识别、空气质量推断等领域产生了广泛影响,为城市计算和智慧城市研究提供了重要的数据支持。
当前挑战
Urban Datasets 在解决城市数据分析问题时面临多重挑战。首先,数据来源的多样性和异构性增加了数据融合的难度,不同数据格式、时间尺度和空间分辨率需要复杂的预处理和标准化操作。其次,数据质量参差不齐,部分数据存在缺失、噪声或不一致问题,这对数据清洗和补全提出了较高要求。此外,数据隐私和安全问题也不容忽视,尤其是在涉及用户轨迹和位置信息时,如何在数据开放与隐私保护之间取得平衡是一个亟待解决的难题。最后,跨领域数据的融合与分析需要开发新的算法和模型,以应对城市数据中复杂的时空依赖性和多维度关联性。
常用场景
经典使用场景
Urban Datasets广泛应用于城市计算和智能交通系统的研究中,特别是在分析城市交通流量、空气质量监测和公共设施使用模式方面。这些数据集通过整合来自不同城市的多源数据,如交通轨迹、空气质量监测站数据、共享单车使用记录等,为研究人员提供了一个全面的城市活动视图。
解决学术问题
该数据集解决了城市科学中的多个关键问题,如城市交通流量预测、空气质量实时监测与预测、以及城市噪音污染分析。通过提供高精度和多维度的数据,研究人员能够更准确地模拟和预测城市环境变化,从而为城市规划和管理提供科学依据。
实际应用
在实际应用中,Urban Datasets被用于优化城市交通管理、改善空气质量监测系统、以及提升公共安全。例如,通过分析共享单车和出租车的数据,城市管理者可以更有效地规划交通路线和公共设施布局,减少交通拥堵和环境污染。
数据集最近研究
最新研究方向
近年来,随着智慧城市概念的兴起,Urban Datasets在多个前沿研究方向上展现出重要价值。特别是在城市交通流量预测、空气质量监测以及人群流动模式分析等领域,该数据集为研究者提供了丰富的数据支持。例如,基于GeoLife轨迹数据集的研究,推动了移动模式挖掘和用户活动识别技术的发展;而结合Foursquare签到数据的研究,则深化了基于位置的服务和社交网络分析。此外,北京和上海的空气质量数据为城市环境监测和预测提供了重要依据,进一步推动了跨领域数据融合方法的研究。这些研究方向不仅提升了城市管理的智能化水平,也为应对城市化进程中的挑战提供了科学依据。
以上内容由遇见数据集搜集并总结生成



