five

Jízdní řády České republiky - GTFS Dataset

收藏
github2026-02-09 更新2026-02-11 收录
下载链接:
https://github.com/tangero/jizdni-rady-czech-republic
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含捷克共和国公共交通(城市公共交通和区域线路)的完整时间表信息,整合了多个公开可用来源的数据。数据集覆盖215个交通机构、61,052个独特站点、6,735条交通线路(4,588条城市公共交通线路和2,147条区域线路)以及384,685个日常班次。

This dataset provides comprehensive schedule information for public transportation in the Czech Republic, including both urban public transit and regional routes, and integrates data from multiple publicly available sources. The dataset covers 215 transportation agencies, 61,052 unique stops, 6,735 total transit routes (4,588 urban public transit routes and 2,147 regional routes), and 384,685 daily scheduled trips.
创建时间:
2026-02-09
原始信息汇总

Jízdní řády České republiky - GTFS 数据集概述

数据集简介

这是一个以标准GTFS格式提供的捷克共和国公共交通数据的聚合与整合数据集。它包含了捷克全国城市公共交通(MHD)和区域线路的完整时刻表信息,整合了多个公开可用的数据源。

数据集覆盖范围

  • 交通机构:215个
  • 唯一站点:61,052个
  • 交通线路:6,735条(4,588条城市公共交通线路 + 2,147条区域线路)
  • 每日班次:384,685班(301,953班城市公共交通 + 82,732班区域交通)
  • 停靠时间记录:690万条

数据结构

数据集按类别分为三个主要目录:

data/mhd/

包含捷克全国各城市的城市公共交通(MHD)数据。

  • 标准GTFS文件
    • agency.txt:215个交通机构
    • stops.txt:61,052个站点
    • routes.txt:4,588条MHD线路(电车、地铁、城市公交车)
    • trips.txt:301,953个班次
    • stop_times.txt.gz:590万条到站/离站记录(压缩后45 MB,未压缩226 MB)

data/regional/

包含区域及长途班次(火车、城际公交车)数据。

  • 标准GTFS文件
    • agency.txt:215个交通机构(共享)
    • stops.txt:61,052个站点(共享)
    • routes.txt:2,147条区域线路
    • trips.txt:82,732个班次
    • stop_times.txt:100万条到站/离站记录(未压缩39 MB)

data/merged/

包含用于应用程序的完整集成数据集(MHD + 区域)。

  • 包含内容
    • 上述所有数据整合于一个数据集
    • calendar_dates.txt:158万条日历例外(国定假日、假期)
    • stop_times.txt.gz:690万条记录(压缩后52 MB,未压缩265 MB)

包含城市公共交通的城市列表

州首府城市

布拉格(PID)、布尔诺(IDSJMK)、俄斯特拉发(ODIS)、比尔森、利贝雷茨、奥洛穆茨、拉贝河畔乌斯季、赫拉德茨-克拉洛韦、捷克布杰约维采、帕尔杜比采、兹林、哈维若夫、克拉德诺、卡罗维发利

其他城市(95个)

包括亚当诺夫、阿什、贝内绍夫、比利纳、布兰斯科、拉贝河畔布兰代斯、布雷茨拉夫、布伦塔尔、比斯特日采-佩尔恩什泰因、捷克特申、捷克利帕、捷克克鲁姆洛夫、杰钦、多马日利采、杜赫佐夫、拉贝河畔杜夫尔-克拉洛韦、弗里代克-米斯泰克、哈夫利奇库夫布罗德、霍多宁、霍日采、赫拉尼采、亚布洛内茨-尼索、亚希莫夫、伊钦、伊赫拉瓦、因德日赫赫拉德茨、卡尔维纳、奥赫日河畔克拉什特雷茨、科林、奥尔利采河畔科斯特莱茨、克拉卢皮-纳德-弗尔塔沃、克罗梅日什、克尔诺夫、基约夫、利托梅日采、利托米什尔、洛乌尼、洛沃西采、玛丽亚温泉市、姆拉达-博莱斯拉夫、米莱夫斯科、布尔迪山麓姆尼谢克、莫斯特、纳霍德、新韦斯、摩拉维亚新城、奥帕瓦、奥尔洛瓦、奥斯特罗夫、佩尔赫日莫夫、皮塞克、波利奇卡、普舍卢奇、普热罗夫、普日布拉姆、普罗斯捷约夫、日恰尼、罗基察尼、拉贝河畔鲁德尼采、克涅日纳河畔里赫诺夫、斯拉尼、索科洛夫、什平德莱鲁夫-姆林、什捷蒂、斯特拉科尼采、斯特日布罗、斯图登卡、舒姆佩克、塔博尔、塔霍夫、特普利采、特热比奇、特日内茨、特鲁特诺夫、图尔诺夫、奥尔利采河畔蒂尼什捷、乌赫尔堡-赫拉迪什捷、瓦拉什斯凯-梅济日奇、瓦尔恩斯多夫、大梅济日奇、温佩尔克、弗拉希姆、弗尔赫拉比、弗塞廷、维什科夫、兹诺伊莫、萨扎瓦河畔日贾尔、扎布日赫、扎泰茨

详细统计

总体概览

类别 线路 班次 停靠时间记录 大小
城市公共交通 (MHD) 4,588 301,953 590万 226 MB
区域交通 2,147 82,732 100万 39 MB
总计 6,735 384,685 690万 265 MB

覆盖情况

  • 215个交通机构(城市交通公司、捷克铁路、私营运营商)
  • 61,052个唯一站点(遍布捷克共和国)
  • 158万条日历例外(节假日、假期、周末)

交通类型分布

类型 GTFS route_type 线路数量
电车 0 约600条
地铁 1 3条(布拉格)
火车 2 约1,900条
公交车 3 约4,200条

使用说明

关于压缩文件的说明

大型的 stop_times.txt 文件因GitHub限制已使用gzip压缩(.txt.gz)。GTFS规范官方支持gzip压缩文件,大多数工具会自动解压。

解压方法(如需未压缩文件): bash gunzip data/mhd/stop_times.txt.gz gunzip data/merged/stop_times.txt.gz

快速开始示例(Python)

python import csv import gzip

读取站点(未压缩)

with open(data/mhd/stops.txt, r, encoding=utf-8) as f: reader = csv.DictReader(f) stops = list(reader) print(f"找到 {len(stops)} 个站点")

读取线路(未压缩)

with open(data/mhd/routes.txt, r, encoding=utf-8) as f: reader = csv.DictReader(f) routes = list(reader) print(f"找到 {len(routes)} 条线路")

读取停靠时间(压缩 - 直接读取)

with gzip.open(data/mhd/stop_times.txt.gz, rt, encoding=utf-8) as f: reader = csv.DictReader(f) # 逐行处理以节省内存 for row in reader: print(row[trip_id], row[stop_id]) break # 示例 - 仅显示第一行

导入数据库示例

bash

PostgreSQL with PostGIS

createdb transit_cz psql transit_cz < import_gtfs.sql

SQLite

sqlite3 transit.db < import_gtfs.sql

数据格式与内容

数据集采用标准 GTFS (通用交通数据规范) 格式。

核心文件示例

  • agency.txt:运营线路的交通机构。
  • stops.txt:站点和车站。
  • routes.txt:交通线路。
  • trips.txt:线路上的具体班次。
  • stop_times.txt:站点上的到站和离站时间。
  • calendar.txt:时刻表有效性的日历。

已知限制与注意事项

GPS坐标

当前版本中的站点GPS坐标设置为 0.0, 0.0。如需精确定位,建议:

  • 使用地理编码服务(如Google Maps API, Nominatim)
  • 手动补充坐标
  • 与官方站点注册表关联

时间覆盖范围

数据集包含的时刻表有效期:

  • 起始日期: 2026-02-08
  • 结束日期: 2027-02-08

数据范围

数据集主要覆盖:

  • ✅ 城市公共交通(MHD)- 完整
  • ⚠️ 区域公交车 - 部分线路
  • ⚠️ 火车班次 - 部分线路

建议结合以下来源获取完整时刻表:

数据来源

本数据集通过聚合和整合公开可用的时刻表数据源创建,包括:

  • 来自 portal.cisjr.cz(全国时刻表信息系统)的官方GTFS数据
  • PID(布拉格综合交通) - 布拉格和中波希米亚州的完整时刻表
  • 区域交通系统 - 如ODIS, IDSJMK, IDOL等
  • 城市交通公司 - 捷克全国各城市的MHD数据

数据经过去重、标准化和分类,便于在分析和导航应用中使用。

许可信息

数据集根据 CC BY 4.0(知识共享署名 4.0 国际许可协议)提供。

您可以:

  • ✅ 共享 - 复制和分发
  • ✅ 改编 - 混编、转换、基于此创作
  • ✅ 用于商业目的

条件:

  • 署名 - 您必须注明来源链接

版本信息

  • 版本: 2.0.0
  • 最后更新: 2026-02-08
  • 格式: GTFS(通用交通数据规范)
  • 数据集大小: 约530 MB(完整)
  • 来源: GTFS_CR, PID, 自有聚合
搜集汇总
数据集介绍
main_image_url
构建方式
在公共交通数据集成领域,该数据集通过系统化地聚合与整合捷克共和国境内多个公开可用的交通数据源构建而成。其构建过程涵盖了从官方GTFS数据门户、区域交通系统以及城市交通运营商的原始数据中提取信息,随后进行去重、标准化与分类处理,最终形成统一且结构化的数据集。这一方法确保了数据的全面性与一致性,为后续分析与应用奠定了坚实基础。
特点
该数据集以其广泛的覆盖范围和精细的数据结构而著称,囊括了215家交通运营商、61,052个独特站点以及6,735条交通线路,每日运营班次达384,685趟。数据按城市公共交通与区域交通分类存储,并提供了合并版本以便于集成应用。特别值得注意的是,数据集包含了约158万条日历例外记录,如节假日与周末安排,这增强了其在实际场景中的实用性。
使用方法
用户可通过标准GTFS兼容工具直接利用该数据集进行交通分析、路径规划或可视化应用。数据集中的大型文件如stop_times.txt以gzip格式压缩,支持大多数GTFS处理工具自动解压。对于编程使用,提供了Python示例代码,演示如何读取CSV文件及处理压缩数据。此外,数据集可导入PostgreSQL或SQLite等数据库系统,并推荐使用GTFS Viewer、OpenTripPlanner等工具进行进一步的可视化与路由分析。
背景与挑战
背景概述
在智能交通系统与城市计算领域,公开、标准化的公共交通数据对于路径规划、可达性分析及服务优化至关重要。Jízdní řády České republiky - GTFS Dataset 作为一个综合性数据集,由捷克国内公共交通数据的多个公开来源聚合与整合而成,遵循国际通用的GTFS(通用交通数据规范)格式。该数据集覆盖了捷克全国范围内的城市公共交通与区域交通网络,包含215家交通运营商、超过6.7千条线路及近38.5万条日常班次记录,自2026年发布以来,为交通研究、应用开发及政策分析提供了重要的数据基础,显著提升了捷克公共交通数据的可访问性与互操作性。
当前挑战
该数据集在解决公共交通数据整合与标准化这一领域问题时,面临多重挑战。首先,数据来源的异构性与分散性导致在聚合过程中需克服格式不一致、命名冲突及时间表重叠等问题,确保数据的完整性与一致性。其次,构建过程中,大量停靠点的地理坐标缺失(当前设置为0.0, 0.0)限制了基于位置的精确分析,需依赖外部地理编码服务或手动补充。此外,区域铁路与长途巴士线路的覆盖尚不完整,需持续扩展以提供全国范围内的无缝交通网络视图。这些挑战共同指向了大规模多源交通数据集成在质量保证与时空覆盖方面的复杂性。
常用场景
经典使用场景
在公共交通规划与智能交通系统研究中,Jízdní řády České republiky - GTFS Dataset 的经典应用场景体现在多模态交通网络的整合分析上。该数据集通过标准化的GTFS格式,将捷克共和国境内215家运输机构的城市公共交通与区域线路数据进行了系统化聚合,覆盖了超过6.7千条线路和38万余个日常班次。研究人员能够利用其统一的结构,深入探究全国范围内的时刻表协调性、换乘枢纽的效率以及不同交通模式间的衔接问题,为构建一体化、高效率的公共交通体系提供了坚实的数据基础。
实际应用
在实际应用层面,该数据集是开发实时导航、出行规划应用及交通信息服务的核心数据源。开发者可以基于其整合的MHD与区域线路数据,构建覆盖捷克全境的行程规划引擎,为用户提供包含地铁、电车、火车及巴士在内的多模式换乘方案。此外,城市规划部门可利用该数据集进行交通可达性评估,例如分析学校、医院等关键设施的公共交通覆盖情况,为基础设施投资和线路优化提供决策支持。数据集的开放性与标准化也促进了第三方创新应用的涌现。
衍生相关工作
围绕该数据集,已衍生出一系列经典的学术与工程实践工作。在工具生态方面,催生了针对捷克语环境的GTFS数据验证、清洗与可视化工具链。在研究领域,它支撑了多项关于中欧地区公共交通网络结构、通勤模式识别以及碳排放评估的实证研究。此外,数据集作为开源项目stredniskoly.cz的核心组成部分,直接推动了针对捷克中学公共交通可达性的大规模空间分析,这一工作为教育公平与交通规划的交叉研究树立了典范,并激励了类似数据整合项目在其他地区的开展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务