omshrivastava/APOO-Indian-Traffic-Dataset
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/omshrivastava/APOO-Indian-Traffic-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
APOO印度交通数据集是一个合成的训练数据集,专为印度异构交通条件设计,用于训练预测信号之间排班旅行时间的机器学习模型。数据集包含5,000个样本,具有20个输入特征,如路段长度、速度限制、车道数量、道路坡度、侧向摩擦、车辆类型比例、交通密度等。目标变量包括实际旅行时间和排班分散时间。数据集还详细说明了校准来源,如PCU值、速度-密度模型、天气影响、车辆混合配置等。
# APOO印度交通数据集
本数据集为**自适应车队偏移优化器(Adaptive Platoon Offset Optimizer, APOO)**的合成训练数据,该框架用于印度交通信号协调优化。
## 概述
共包含5000条针对印度混合交通环境校准的合成样本,专为训练可预测信号间车队行驶时间的机器学习模型设计。
## 数据集元数据
- 配置名称:default
- 特征字段:
- 字段名:link_length_m,数据类型:float64
- 字段名:speed_limit_kmh,数据类型:float64
- 字段名:num_lanes,数据类型:int64
- 字段名:gradient_pct,数据类型:float64
- 字段名:side_friction,数据类型:float64
- 字段名:pct_two_wheeler,数据类型:float64
- 字段名:pct_car,数据类型:float64
- 字段名:pct_auto,数据类型:float64
- 字段名:pct_bus,数据类型:float64
- 字段名:pct_truck,数据类型:float64
- 字段名:density_veh_km_lane,数据类型:float64
- 字段名:weather_speed_factor,数据类型:float64
- 字段名:time_of_day_sin,数据类型:float64
- 字段名:time_of_day_cos,数据类型:float64
- 字段名:is_peak,数据类型:int64
- 字段名:is_weekend,数据类型:int64
- 字段名:platoon_size,数据类型:int64
- 字段名:platoon_pcu,数据类型:float64
- 字段名:upstream_queue_pcu,数据类型:float64
- 字段名:downstream_queue_pcu,数据类型:float64
- 字段名:actual_travel_time_s,数据类型:float64
- 字段名:platoon_dispersion_s,数据类型:float64
- 字段名:weather,数据类型:字符串
- 字段名:city_type,数据类型:字符串
- 字段名:mix_type,数据类型:字符串
- 标签:交通、印度、交通工程、信号控制、合成数据集、表格型数据集
- 样本规模:1000 < 样本数 < 10000
- 任务类别:表格回归
- 语言:英语
## 特征(共20个输入特征)
| 特征名称 | 特征描述 | 取值范围 |
|---------|-------------|-------|
| `link_length_m` | 信号间链路距离 | 150-600米 |
| `speed_limit_kmh` | 法定限速 | 30-60千米/小时 |
| `num_lanes` | 车道数量 | 2-4条 |
| `gradient_pct` | 道路坡度 | -3% 至 +3% |
| `side_friction` | 来自摊贩、占道停车的侧向干扰(印度专属特征) | 0.1-0.6 |
| `pct_two_wheeler` | 两轮车占比 | 40%-70% |
| `pct_car` | 小型轿车占比 | 10%-30% |
| `pct_auto` | 机动三轮车占比 | 5%-15% |
| `pct_bus` | 公交车占比 | 3%-8% |
| `pct_truck` | 重型卡车占比 | 1%-6% |
| `density_veh_km_lane` | 单车道交通密度 | 10-80辆/千米/车道 |
| `weather_speed_factor` | 天气对行驶速度的影响系数 | 0.65-1.0 |
| `time_of_day_sin/cos` | 昼夜周期循环编码 | [-1, 1] |
| `is_peak` | 高峰时段标识 | 0/1 |
| `is_weekend` | 周末时段标识 | 0/1 |
| `platoon_size` | 车队内总车辆数 | 5-40辆 |
| `platoon_pcu` | 以乘客当量表(Passenger Car Unit, PCU)计量的车队当量 | 遵循IRC:106标准加权计算 |
| `upstream/downstream_queue_pcu` | 上下游排队长度(以PCU计量) | 0-30 PCU |
## 目标变量
- `actual_travel_time_s`:实际行驶时间(单位:秒,均值约52秒,取值范围7-217秒)
- `platoon_dispersion_s`:混合交通流导致的车队离散程度(单位:秒)
## 校准依据
- **乘客当量表(PCU)参数**:遵循IRC:106-1990标准(两轮车=0.5,机动三轮车=0.6,公交车=3.0)
- **速度-密度模型**:采用Greenshields模型,阻塞密度设为150辆/千米/车道
- **天气影响系数**:预设天气速度影响系数(暴雨天气对应系数为0.65)
- **车辆混合分布**:共4种场景配置(大都市/二线城市 × 高峰/非高峰时段)
- **车队离散模型**:参考Kadiyali(2000)、Mathew与Krishna Rao(2006)的研究成果
## 使用方法
python
import pandas as pd
df = pd.read_csv("data/train.csv")
# 特征集与目标变量
FEATURES = [c for c in df.columns if c not in ["actual_travel_time_s", "platoon_dispersion_s", "weather", "city_type", "mix_type"]]
X = df[FEATURES]
y = df["actual_travel_time_s"]
## 关联应用
交互式可视化仪表盘:[APOO交通优化器](https://huggingface.co/spaces/omshrivastava/APOO-Traffic-Optimizer)
提供机构:
omshrivastava



