Transit Nightmare Dataset
收藏github2025-02-22 更新2025-03-15 收录
下载链接:
https://github.com/The-Baltimore-Banner/transit_nightmare
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含巴尔的摩市学生通勤的数据,用于分析学生通过公共交通到达学校的路线和时间。数据集包括学校与家庭普查区的组合、实时公交位置数据以及从美国人口普查局和马里兰州交通管理局获取的外部数据。
This dataset contains data on student commuting in the City of Baltimore, and is used to analyze the routes and travel times of students arriving at school via public transit. The dataset includes pairings of schools and home census tracts, real-time bus location data, as well as external data sourced from the U.S. Census Bureau and the Maryland Transit Administration.
创建时间:
2025-02-15
原始信息汇总
数据集概述
数据集名称
Transit nightmare: Thousands of Baltimore kids can’t get to school on time
数据集描述
本数据集关注巴尔的摩市中学生在选择学校后,由于缺乏校车服务,不得不依赖公共交通工具上学的问题。数据集通过分析超过数千万条实时公共交通数据,评估了学生按时到达学校的可能性。
数据内容
- 包含学生上学路线的数据,以及用于重建分析所需的各种数据和结果。
- 数据分为两部分:学校交通数据(需40GB存储空间)和实时公交车位置数据(需350GB存储空间)。
- 需要从美国人口普查局和MTA获取额外数据,需要API密钥。
方法论
- 使用r5路由模型估计每个学生上学的最快路线。
- 结合OpenStreetMaps数据、MTA的GTFS调度和路线数据、学生出发时间等信息计算最短路线。
- 使用
r5r的detailed_iteneraries功能获取每个路线的详细信息。 - 比较公共交通工具和私家车上学通勤时间。
局限性
- 路由分析基于人口普查区数据,存在精度限制。
- 学生实际路线可能因个人偏好和条件变化而有所不同。
- 模型无法考虑公共交通系统的可靠性问题。
- 实时数据中约10%的行程缺失,影响准时率计算。
许可
- 本数据集遵循版权法2025,The Venetoulis Institute for Local Journalism发布。
- 允许源代码和二进制形式的再分配和使用,但需保留版权声明和条件。
- 不得使用数据集名称或贡献者名称推广派生产品,除非有书面许可。
- 数据集按“原样”提供,不提供任何明示或暗示的保证。
搜集汇总
数据集介绍

构建方式
本研究通过采集巴尔的摩市学生的家庭住址和学校信息,运用r5路由模型,结合OpenStreetMaps数据、Maryland Transit Administration提供的GTFS调度和路线数据,以及人口分布数据,构建了每位学生到学校的最快路线模型。此外,研究还通过实时公交位置数据,评估了MTA公交的可靠性。
特点
该数据集包含数十万行实时公交数据,覆盖了巴尔的摩市所有中学和高中学生的家庭住址到学校的路线信息。数据集的特点在于其详尽的路由分析,以及对公交可靠性的实时跟踪。此外,数据集还提供了对每种交通方式的使用情况、路线选择和换乘次数的统计。
使用方法
用户可以通过下载数据文件夹来重现分析过程,或使用提供的API密钥获取美国人口普查局和MTA的数据。对于处理原始JSON公交位置数据,需要本地硬盘空间约350GB。使用前,用户需确保有足够的硬盘空间,并根据需要获取相应的API密钥。
背景与挑战
背景概述
Transit Nightmare Dataset是一个聚焦于巴尔的摩市学生上下学通勤问题的数据集。该数据集由Greg Morton于2023年创建,旨在揭示巴尔的摩市公共交通系统对于中学生和高中生上下学通勤的挑战。该数据集依托于对超过4200条上学路线的建模,结合了开放街图数据、马里兰州交通管理局提供的GTFS调度和路线数据,以及人口分布数据,以估算每个学生最快捷的上学路线。这一研究为理解城市学生面临的通勤难题提供了重要视角,并对教育公平和交通规划领域产生了显著影响。
当前挑战
该数据集在构建过程中遇到了多项挑战:1) 如何在保护学生隐私的同时,精确地确定每个学生从家到学校的通勤路线;2) 考虑到学生个体路线偏好的差异性,模型需在多种可能的路线中做出选择,而这一选择可能并不完全符合每个学生的实际习惯;3) 模型无法准确计入公共交通系统的可靠性问题,例如延误或取消的班次;4) 实时公交数据中约10%的班次缺失,影响了准时率的准确计算;5) 由于API使用限制,数据集收集重点只能放在公交车上,而无法全面涵盖地铁和轻轨等其他公共交通方式。
常用场景
经典使用场景
Transit Nightmare Dataset是一个深入探讨巴尔的摩市学生上下学交通问题的数据集。其经典使用场景在于,研究者或政策制定者可通过该数据集分析学生上下学的公共交通路线,评估公共交通的可靠性,以及学生实际到达学校的时间。这有助于教育部门优化学生通勤路线,确保学生能够准时到达学校,提高教育质量。
实际应用
在实践应用方面,该数据集可用于指导巴尔的摩市公共交通系统的改进,例如优化公交线路、调整车辆调度,以及改善学生的通勤体验。此外,该数据集还可为城市规划者提供有关城市交通基础设施的洞见,以促进城市的可持续发展。
衍生相关工作
基于Transit Nightmare Dataset,衍生了多项相关研究工作。这些研究包括但不限于分析公共交通对学生教育成绩的影响,评估不同交通政策对学生通勤时间的改善效果,以及探索城市交通规划与学生通勤体验之间的关系。这些研究有助于推动城市交通和教育政策的制定与优化。
以上内容由遇见数据集搜集并总结生成



