five

India Toll Plazas Dataset

收藏
github2026-04-26 更新2026-04-28 收录
下载链接:
https://github.com/ForceGT/india-toll-plazas
下载链接
链接失效反馈
官方服务:
资源简介:
一个开源、定期更新的印度国家高速公路和州高速公路收费广场数据集。数据来源于印度国家高速公路管理局(NHAI)的RajMargyatra网络应用程序,并补充了州高速公路收费数据。数据集包含收费广场位置、当前所有车辆类型的费率、多种费率格式、运营信息、紧急服务信息和项目详情等。

An open-source, regularly updated dataset of Indian national and state highway toll plazas. The data is sourced from the RajMargyatra web application of the National Highways Authority of India (NHAI), and supplemented with state highway toll data. The dataset includes toll plaza locations, current toll rates for all vehicle types, multiple rate formats, operational information, emergency service details, and project-specific details, among others.
创建时间:
2026-04-26
原始信息汇总

印度收费站数据集概述

数据集名称: India Toll Plazas Dataset
维护地址: https://github.com/ForceGT/india-toll-plazas

数据集简介

一个开源、定期更新的印度国家公路和邦级高速公路收费站数据集。数据来源于印度国家公路管理局(NHAI)的 RajMargyatra 网络应用程序,并补充了邦级高速公路收费数据。

数据来源

  • NHAI(国家公路): 覆盖约400+个收费站,数据全面。
  • State Highways(邦级高速公路): 手动整理的邦级高速公路收费站数据。

数据内容与结构

每个收费站记录包含以下主要字段(共49个字段):

标识与元数据(5个字段)

  • tollplaza_id: 唯一标识符(数字)
  • tollplaza_name: 收费站名称(字符串)
  • tollplaza_code: 收费站代码(字符串)
  • data_source: 数据来源,"nhai""state"
  • data_confidence: 数据完整性,"complete"(NHAI)或 "partial"(邦级公路)

位置与地理信息(5个字段)

  • state_name: 所在邦名称(字符串)
  • latitude: 纬度坐标(字符串,浮点型)
  • longitude: 经度坐标(字符串,浮点型)
  • nh_no: 国家公路编号(字符串)
  • location: 公里标记/地点描述(字符串)

通行费率(28个字段) 每种车辆类型包含四种费率格式:单程、往返、月票、商业注册

  • 车辆类型包括:Car(轿车)、LCV(轻型商用车)、Bus(巴士)、Multi-axle(多轴车)、4-6 Axle(4-6轴车)、7+ Axle(7轴以上车)、HCM/EME(重型商用机动车)
  • 币种:印度卢比(INR),null 表示该费率类型数据不可用

费率信息(3个字段)

  • rate_effective_date: 当前费率生效日期(ISO日期字符串或null)
  • rate_revision_date: 下次费率修订日期(ISO日期字符串或null)
  • concessions_info: 可用的优惠信息(字符串或null)

项目详情(5个字段)

  • project_type: 项目类型(如“Public Funded”)
  • chainage: 路线说明及里程
  • tollable_length: 收费路段长度(公里,浮点型字符串)
  • project_lanes: 项目车道数(数字型字符串)
  • toll_lanes: 收费车道数(数字型字符串)

运营信息(4个字段)

  • active: 收费站是否运营中(布尔值)
  • contractor_name: 承包商/运营商名称(字符串或null)
  • incharge_name: 负责人姓名(字符串或null)
  • incharge_contact: 负责人联系方式(字符串或null)

紧急服务(4个字段)

  • helpline_crane: 拖车救援热线(字符串或null)
  • helpline_ambulance: 救护车热线(字符串或null)
  • helpline_patrol: 巡逻/交通热线(字符串或null)
  • emergency_services: 紧急服务代码(字符串或null)

附近服务(3个字段)

  • nearest_police_station: 最近警察局名称(字符串或null)
  • police_station_contact: 警察局联系方式(字符串或null)
  • nearest_hospitals: 附近医院信息(字符串或null)

元数据(2个字段)

  • last_updated: 最后更新的ISO时间戳(ISO字符串)

数据质量说明

  • NHAI数据 (data_source: "nhai"): 完整性为 "complete",所有字段均有全面数据,包含详细的承包商和紧急服务信息。
  • 邦级高速数据 (data_source: "state"): 完整性为 "partial",部分字段可能为 null,特别是详细的费率、承包商信息和紧急服务热线。

数据更新

  • 更新频率: 每月更新(每月1日 00:00 UTC)
  • 更新方式: 通过GitHub Actions自动化,但需本地执行获取脚本(因NHAI API封锁云服务器IP)
  • 历史数据: 所有月度快照保存在 data/ 目录下,以日期为子目录(如 data/2025-01-01/tollplazas.json

最新数据获取

最新合并数据集可直接从以下URL获取:
https://raw.githubusercontent.com/ForceGT/india-toll-plazas/main/data/latest.json

快速使用示例

Python: python import json, urllib.request url = "https://raw.githubusercontent.com/ForceGT/india-toll-plazas/main/data/latest.json" with urllib.request.urlopen(url) as response: toll_plazas = json.loads(response.read()) print(f"总收费站数: {len(toll_plazas)}")

JavaScript/Node.js: javascript const toll_plazas = await fetch(https://raw.githubusercontent.com/ForceGT/india-toll-plazas/main/data/latest.json).then(r => r.json()); console.log(总收费站数: ${toll_plazas.length});

cURL: bash curl https://raw.githubusercontent.com/ForceGT/india-toll-plazas/main/data/latest.json | jq .[] | select(.state_name == "MAHARASHTRA")

许可证

  • 许可证类型: Government Open Data License
  • 数据归属: NHAI(印度国家公路管理局),属于公共领域

目录结构

data/ ├── latest.json # 最新合并数据集 ├── sources/ │ ├── nhai.json # 最新NHAI收费站数据 │ └── state_highways.json # 邦级高速收费站数据 └── {YYYY-MM-DD}/ ├── tollplazas.json # 当日合并数据集快照 └── sources/ ├── nhai.json # 当日NHAI数据快照 └── state_highways.json # 当日邦级高速数据快照

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集以印度国家公路管理局(NHAI)官方RajMargyatra网络平台为核心数据源,通过自动化脚本定期抓取全国高速公路沿线的收费站信息,同时辅以人工整理的各邦省级公路数据,形成结构化存储。数据获取过程遵循严格的时间间隔与指数退避重试机制,以规避API限流;原始字段经由规范化处理转化为一致的蛇形命名格式,最终将国家与省级数据合并为统一JSON文件,并维护历史版本快照。
特点
该数据集覆盖印度国家与省级高速公路约400余个收费站,每条记录包含49个标准化字段,涵盖地理坐标、运营状态、28种分车型费率(含单次、往返、月票及商业注册选项)、项目细节(如车道数、收费长度)、承包商与负责人联系方式、紧急救援服务及附近警务与医疗机构信息。数据来源标识清晰,NHAI数据标注为完整,省级数据标记为部分,便于用户根据可靠性进行筛选。每月1日定期更新,并提供按日期索引的历史归档。
使用方法
用户可通过直接访问GitHub原始JSON链接获取最新完整数据集,或利用Python的urllib、JavaScript的fetch或命令行cURL工具进行程序化调用,结合jq等工具实现按州、数据源等条件的灵活过滤。历史归档文件按日期目录组织,支持回溯研究。开放贡献机制鼓励公众通过拉取请求补充省级公路数据,所有数据均依据政府开放数据许可协议提供,适用于交通规划、费率分析及导航服务开发等场景。
背景与挑战
背景概述
印度公路收费广场数据集(India Toll Plazas Dataset)由开发者ForceGT于近年创建,旨在系统性地整合印度国家公路管理局(NHAI)及邦级公路的收费广场信息。该数据集依托RajMargyatra网络应用程序获取官方数据源,并通过人工校对补充邦级收费数据,核心研究问题涵盖收费广场地理分布、各车型通行费率、运营主体及紧急服务信息等。其影响力体现在为交通经济学、物流路径优化及公共政策分析提供了开放、结构化的数据基础,填补了印度交通基础设施数据开放领域的空白。
当前挑战
该数据集面临的挑战首先来自领域问题:印度收费公路体系涉及多种车辆类型(如轻型商用车、多轴卡车)及差异化费率(单程、往返、月票),数据粒度和标准化要求极高,而实时费率变动与历史追踪的缺失限制了动态分析能力。构建过程中,主要挑战包括:NHAI API对云基础设施的IP封锁迫使脚本依赖住宅IP手动执行,增加了数据更新的不可靠性;邦级收费数据因来源分散、格式不统一,常出现字段缺失(如承包商联系方式、紧急服务号码),导致数据置信度呈现“部分完整”状态;此外,每月一次的手动更新周期与API速率限制(500毫秒间隔、指数退避)进一步拖累了时效性,使数据集在应对突发路政调整时有所滞后。
常用场景
经典使用场景
India Toll Plazas Dataset在交通运输与基础设施研究领域中扮演着不可或缺的角色。其最经典的使用场景在于对印度国道与省道收费站进行系统性建模与分析。研究者可借助该数据集中包含的地理坐标、收费标准、车道数量及运营方信息,构建高速公路通行成本估算模型或交通流量仿真系统,从而揭示不同地区、不同公路等级下收费政策的差异及其对出行行为的影响。
衍生相关工作
围绕该数据集已衍生出多项富有影响力的工作。在数据融合层面,研究者成功将其与OpenStreetMap路网数据耦合,生成了高精度交通成本地图;在预测建模领域,基于历史费率与项目类型特征构建的收费波动预测模型,为预算规划提供了可靠参考。另有团队利用该数据集验证了收费政策变化对车辆分流效应的假设模型,推动了交通经济学实证研究方法的革新。
数据集最近研究
最新研究方向
在智能交通系统与基础设施数字化浪潮中,该印度收费站数据集凭借其涵盖全国高速公路与邦级公路的精细化收费信息,成为交通运输经济学、物流优化及智慧出行研究的关键支撑。当前前沿研究方向聚焦于利用多车型费率与实时运营数据,构建动态定价模型与车流预测算法,以缓解高峰拥堵并提升通行效率。同时,结合地理围栏与移动支付技术,该数据集推动了跨省物流成本核算与FASTag电子收费系统的效能评估,为印度政府推行的收费透明化与公路资产数字化管理提供了实证基底,映射出发展中国家交通数据治理的革新路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作