bmrcl-ridership-hourly
收藏github2025-10-01 更新2025-10-03 收录
下载链接:
https://github.com/Vonter/bmrcl-ridership-hourly
下载链接
链接失效反馈官方服务:
资源简介:
印度班加罗尔BMRCL运营的Namma Metro地铁网络每小时站点客流量的数据集,数据来源于RTI,涵盖2025年8月1日至2025年8月18日期间,包括黄线开通前后的时间段
A dataset of hourly passenger footfall at individual stations across the Namma Metro rail network operated by the Bangalore Metro Rail Corporation Limited (BMRCL) in Bengaluru, India. The data is sourced from Right to Information (RTI) filings, covering the period from August 1 to August 18, 2025, including the time windows before and after the opening of the Yellow Line.
创建时间:
2025-10-01
原始信息汇总
数据集概述
基本信息
- 数据集名称: bmrcl-ridership-hourly
- 数据来源: 印度班加罗尔BMRCL运营的Namma Metro地铁网络,通过RTI获取
- 数据格式: Parquet文件和CSV压缩文件
- 许可证: Open Database License (ODbL 1.0)
数据内容
数据文件
-
站点小时客流量:
- Parquet格式: https://raw.githubusercontent.com/Vonter/bmrcl-ridership-hourly/main/data/station-hourly.parquet
- CSV压缩格式: https://raw.githubusercontent.com/Vonter/bmrcl-ridership-hourly/main/data/station-hourly.csv.zip
-
站点对小时客流量:
- Parquet格式: https://raw.githubusercontent.com/Vonter/bmrcl-ridership-hourly/main/data/stationpair-hourly.parquet
- CSV压缩格式: https://raw.githubusercontent.com/Vonter/bmrcl-ridership-hourly/main/data/stationpair-hourly.csv.zip
时间范围
- 数据覆盖期间: 2025年8月1日至2025年8月18日
- 包含黄线开通前后时期(黄线于2025年8月11日开通)
数据探索
- 站点小时客流量探索: https://hyparam.github.io/demos/hyparquet/?key=https%3A%2F%2Fraw.githubusercontent.com%2FVonter%2Fbmrcl-ridership-hourly%2Fmain%2Fdata%2Fstation-hourly.parquet
- 站点对小时客流量探索: https://hyparam.github.io/demos/hyparquet/?key=https%3A%2F%2Fraw.githubusercontent.com%2FVonter%2Fbmrcl-ridership-hourly%2Fmain%2Fdata%2Fstationpair-hourly.parquet
可视化
- 班加罗尔地铁使用情况可视化: https://diagramchasing.fun/2025/how-bangalore-uses-the-metro
技术信息
- 数据处理脚本: parse.py(用于解析原始Excel文件生成数据集)
- 依赖要求: 需要安装Python及requirements.txt中的依赖包
- 生成命令:
python parse.py
版权声明
- 数据库部分内容受BMRCL版权保护
- 使用需遵守ODbL许可证的署名、相同方式共享和保持开放要求
搜集汇总
数据集介绍

构建方式
在轨道交通数据科学领域,bmrcl-ridership-hourly数据集通过解析印度班加罗尔地铁运营方BMRCL提供的原始Excel文件构建而成。解析脚本采用Python编程语言实现,将原始运营数据转换为标准化的Parquet和CSV格式,数据覆盖时段精心选取了2025年8月1日至18日这一关键时期,恰逢黄线线路开通前后的运营阶段,为研究地铁网络演化提供了独特视角。
特点
该数据集最显著的特点是同时包含站点级和站点对级两个维度的精细化小时客流统计。站点级数据记录了每个站点按小时的进出站客流量,站点对级数据则捕捉了站点间的小时OD客流模式。数据采用列式存储的Parquet格式和传统CSV格式双重提供,既保证了大数据场景下的查询效率,又兼顾了数据使用的便捷性。时间跨度设计巧妙覆盖了新旧线路交替的特殊时期,为研究地铁网络扩展对客流分布的影响提供了天然实验场景。
使用方法
研究者可通过GitHub仓库提供的可视化链接直接探索数据分布特征,或下载Parquet格式文件用于大规模数据分析。数据集支持多种分析场景:站点级数据适用于单站客流模式识别和站点运营优化研究,站点对级数据则可用于网络客流分析和出行模式挖掘。基于开放数据库许可证,用户在注明数据来源并遵守相同许可条款的前提下,可自由进行数据共享、衍生作品创作和适应性修改,为学术研究和商业应用提供了灵活的使用空间。
背景与挑战
背景概述
班加罗尔地铁小时客流数据集由印度班加罗尔地铁有限公司运营数据构建而成,聚焦于城市轨道交通系统的动态乘客流动模式分析。该数据集通过印度信息权法案获取原始数据,完整记录了2025年8月1日至18日期间涵盖黄线开通前后的关键运营阶段,为研究新兴城市地铁网络演化提供了珍贵时序样本。其核心价值在于通过站点级与站点对级双重粒度,揭示了特大城市公共交通系统在基础设施扩展时期的客流分布规律,对城市规划与运输优化研究具有重要参考意义。
当前挑战
在轨道交通客流预测领域,该数据集需解决非平稳时间序列中突发客流模式的识别难题,特别是新线路开通引发的网络级联效应。数据构建过程中面临原始Excel文件多源异构解析的技术挑战,需保证从复杂表格结构到标准化Parquet格式的无损转换。同时,短期观测窗口限制了长期趋势分析的可行性,而运营数据中隐含的节假日效应与特殊事件影响仍需进一步验证。
常用场景
经典使用场景
在城市交通规划领域,bmrcl-ridership-hourly数据集为研究班加罗尔地铁网络的客流动态提供了精细化的时序数据支撑。该数据集最经典的使用场景体现在轨道交通客流预测模型的构建与验证,研究人员能够基于站点级和站点对级的每小时客流数据,分析地铁系统在不同时段、不同线路的运载特征,为优化列车调度和运力配置提供数据依据。
实际应用
在实际应用层面,该数据集为班加罗尔地铁运营管理部门提供了精准的决策支持。基于站点对级别的客流数据,运营方可识别高频出行路径,优化列车编组和发车间隔;城市规划部门则能利用这些数据评估地铁服务对城市空间结构的影响,指导站点周边土地开发与交通接驳设施布局。这些应用直接提升了地铁系统的运营效率和服务质量。
衍生相关工作
围绕该数据集已衍生出多项经典研究工作,包括基于深度学习的多步客流预测模型、考虑网络效应的地铁客流传播机制分析,以及融合多源数据的城市移动性模式挖掘。可视化项目'How Bangalore Uses The Metro'展示了数据在公众传播和教育领域的创新应用,为后续研究者提供了丰富的分析范式和可视化参考。
以上内容由遇见数据集搜集并总结生成



