Jízdní řády České republiky - GTFS Dataset
收藏Jízdní řády České republiky - GTFS 数据集概述
数据集简介
这是一个以标准GTFS格式提供的捷克共和国公共交通数据的聚合与整合数据集。它包含了捷克全国城市公共交通(MHD)和区域线路的完整时刻表信息,整合了多个公开可用的数据源。
数据集覆盖范围
- 交通机构:215个
- 唯一站点:61,052个
- 交通线路:6,735条(4,588条城市公共交通线路 + 2,147条区域线路)
- 每日班次:384,685班(301,953班城市公共交通 + 82,732班区域交通)
- 停靠时间记录:690万条
数据结构
数据集按类别分为三个主要目录:
data/mhd/
包含捷克全国各城市的城市公共交通(MHD)数据。
- 标准GTFS文件:
agency.txt:215个交通机构stops.txt:61,052个站点routes.txt:4,588条MHD线路(电车、地铁、城市公交车)trips.txt:301,953个班次stop_times.txt.gz:590万条到站/离站记录(压缩后45 MB,未压缩226 MB)
data/regional/
包含区域及长途班次(火车、城际公交车)数据。
- 标准GTFS文件:
agency.txt:215个交通机构(共享)stops.txt:61,052个站点(共享)routes.txt:2,147条区域线路trips.txt:82,732个班次stop_times.txt:100万条到站/离站记录(未压缩39 MB)
data/merged/
包含用于应用程序的完整集成数据集(MHD + 区域)。
- 包含内容:
- 上述所有数据整合于一个数据集
calendar_dates.txt:158万条日历例外(国定假日、假期)stop_times.txt.gz:690万条记录(压缩后52 MB,未压缩265 MB)
包含城市公共交通的城市列表
州首府城市
布拉格(PID)、布尔诺(IDSJMK)、俄斯特拉发(ODIS)、比尔森、利贝雷茨、奥洛穆茨、拉贝河畔乌斯季、赫拉德茨-克拉洛韦、捷克布杰约维采、帕尔杜比采、兹林、哈维若夫、克拉德诺、卡罗维发利
其他城市(95个)
包括亚当诺夫、阿什、贝内绍夫、比利纳、布兰斯科、拉贝河畔布兰代斯、布雷茨拉夫、布伦塔尔、比斯特日采-佩尔恩什泰因、捷克特申、捷克利帕、捷克克鲁姆洛夫、杰钦、多马日利采、杜赫佐夫、拉贝河畔杜夫尔-克拉洛韦、弗里代克-米斯泰克、哈夫利奇库夫布罗德、霍多宁、霍日采、赫拉尼采、亚布洛内茨-尼索、亚希莫夫、伊钦、伊赫拉瓦、因德日赫赫拉德茨、卡尔维纳、奥赫日河畔克拉什特雷茨、科林、奥尔利采河畔科斯特莱茨、克拉卢皮-纳德-弗尔塔沃、克罗梅日什、克尔诺夫、基约夫、利托梅日采、利托米什尔、洛乌尼、洛沃西采、玛丽亚温泉市、姆拉达-博莱斯拉夫、米莱夫斯科、布尔迪山麓姆尼谢克、莫斯特、纳霍德、新韦斯、摩拉维亚新城、奥帕瓦、奥尔洛瓦、奥斯特罗夫、佩尔赫日莫夫、皮塞克、波利奇卡、普舍卢奇、普热罗夫、普日布拉姆、普罗斯捷约夫、日恰尼、罗基察尼、拉贝河畔鲁德尼采、克涅日纳河畔里赫诺夫、斯拉尼、索科洛夫、什平德莱鲁夫-姆林、什捷蒂、斯特拉科尼采、斯特日布罗、斯图登卡、舒姆佩克、塔博尔、塔霍夫、特普利采、特热比奇、特日内茨、特鲁特诺夫、图尔诺夫、奥尔利采河畔蒂尼什捷、乌赫尔堡-赫拉迪什捷、瓦拉什斯凯-梅济日奇、瓦尔恩斯多夫、大梅济日奇、温佩尔克、弗拉希姆、弗尔赫拉比、弗塞廷、维什科夫、兹诺伊莫、萨扎瓦河畔日贾尔、扎布日赫、扎泰茨
详细统计
总体概览
| 类别 | 线路 | 班次 | 停靠时间记录 | 大小 |
|---|---|---|---|---|
| 城市公共交通 (MHD) | 4,588 | 301,953 | 590万 | 226 MB |
| 区域交通 | 2,147 | 82,732 | 100万 | 39 MB |
| 总计 | 6,735 | 384,685 | 690万 | 265 MB |
覆盖情况
- 215个交通机构(城市交通公司、捷克铁路、私营运营商)
- 61,052个唯一站点(遍布捷克共和国)
- 158万条日历例外(节假日、假期、周末)
交通类型分布
| 类型 | GTFS route_type | 线路数量 |
|---|---|---|
| 电车 | 0 | 约600条 |
| 地铁 | 1 | 3条(布拉格) |
| 火车 | 2 | 约1,900条 |
| 公交车 | 3 | 约4,200条 |
使用说明
关于压缩文件的说明
大型的 stop_times.txt 文件因GitHub限制已使用gzip压缩(.txt.gz)。GTFS规范官方支持gzip压缩文件,大多数工具会自动解压。
解压方法(如需未压缩文件): bash gunzip data/mhd/stop_times.txt.gz gunzip data/merged/stop_times.txt.gz
快速开始示例(Python)
python import csv import gzip
读取站点(未压缩)
with open(data/mhd/stops.txt, r, encoding=utf-8) as f: reader = csv.DictReader(f) stops = list(reader) print(f"找到 {len(stops)} 个站点")
读取线路(未压缩)
with open(data/mhd/routes.txt, r, encoding=utf-8) as f: reader = csv.DictReader(f) routes = list(reader) print(f"找到 {len(routes)} 条线路")
读取停靠时间(压缩 - 直接读取)
with gzip.open(data/mhd/stop_times.txt.gz, rt, encoding=utf-8) as f: reader = csv.DictReader(f) # 逐行处理以节省内存 for row in reader: print(row[trip_id], row[stop_id]) break # 示例 - 仅显示第一行
导入数据库示例
bash
PostgreSQL with PostGIS
createdb transit_cz psql transit_cz < import_gtfs.sql
SQLite
sqlite3 transit.db < import_gtfs.sql
数据格式与内容
数据集采用标准 GTFS (通用交通数据规范) 格式。
核心文件示例
agency.txt:运营线路的交通机构。stops.txt:站点和车站。routes.txt:交通线路。trips.txt:线路上的具体班次。stop_times.txt:站点上的到站和离站时间。calendar.txt:时刻表有效性的日历。
已知限制与注意事项
GPS坐标
当前版本中的站点GPS坐标设置为 0.0, 0.0。如需精确定位,建议:
- 使用地理编码服务(如Google Maps API, Nominatim)
- 手动补充坐标
- 与官方站点注册表关联
时间覆盖范围
数据集包含的时刻表有效期:
- 起始日期: 2026-02-08
- 结束日期: 2027-02-08
数据范围
数据集主要覆盖:
- ✅ 城市公共交通(MHD)- 完整
- ⚠️ 区域公交车 - 部分线路
- ⚠️ 火车班次 - 部分线路
建议结合以下来源获取完整时刻表:
数据来源
本数据集通过聚合和整合公开可用的时刻表数据源创建,包括:
- 来自 portal.cisjr.cz(全国时刻表信息系统)的官方GTFS数据
- PID(布拉格综合交通) - 布拉格和中波希米亚州的完整时刻表
- 区域交通系统 - 如ODIS, IDSJMK, IDOL等
- 城市交通公司 - 捷克全国各城市的MHD数据
数据经过去重、标准化和分类,便于在分析和导航应用中使用。
许可信息
数据集根据 CC BY 4.0(知识共享署名 4.0 国际许可协议)提供。
您可以:
- ✅ 共享 - 复制和分发
- ✅ 改编 - 混编、转换、基于此创作
- ✅ 用于商业目的
条件:
- 署名 - 您必须注明来源链接
版本信息
- 版本: 2.0.0
- 最后更新: 2026-02-08
- 格式: GTFS(通用交通数据规范)
- 数据集大小: 约530 MB(完整)
- 来源: GTFS_CR, PID, 自有聚合




