LeoTungAnh/traffic_hourly
收藏Hugging Face2023-12-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LeoTungAnh/traffic_hourly
下载链接
链接失效反馈官方服务:
资源简介:
数据集traffic_hourly包含862个每小时的时间序列数据点,揭示了2015年至2016年期间旧金山湾区高速公路的道路占用率。数据集分为训练、验证和测试三个部分,每个部分包含862个样本。数据预处理包括按小时分组和标准化处理。数据集的特征包括开始时间、目标值、静态分类特征、动态实值特征和项目ID。数据集可用于Huggingface的Transformer、Autoformer、Informer等模型。
数据集traffic_hourly包含862个每小时的时间序列数据点,揭示了2015年至2016年期间旧金山湾区高速公路的道路占用率。数据集分为训练、验证和测试三个部分,每个部分包含862个样本。数据预处理包括按小时分组和标准化处理。数据集的特征包括开始时间、目标值、静态分类特征、动态实值特征和项目ID。数据集可用于Huggingface的Transformer、Autoformer、Informer等模型。
提供机构:
LeoTungAnh
原始信息汇总
数据集概述
数据集信息
- 名称: traffic_hourly
- 描述: 该数据集包含862个每小时的时序数据点,展示了2015年至2016年旧金山湾区高速公路的占用率。
特征信息
- start: 时间戳类型
- feat_static_cat: 无符号64位整数序列
- feat_dynamic_real: 浮点32位序列
- item_id: 字符串类型
- target: 浮点64位序列
数据分割
- train: 120352440字节,862个样本
- validation: 120683448字节,862个样本
- test: 121014456字节,862个样本
数据集大小
- 下载大小: 124542918字节
- 数据集大小: 362050344字节
配置信息
- 默认配置:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*
预处理信息
- 频率: 每小时("1H")
- 预处理技术: 标准化("Std")
数据集格式
- 特征: [start, target, feat_static_cat, feat_dynamic_real, item_id]
- 样本数量: 862
数据示例
- start: 2015年1月1日0时0分1秒
- feat_static_cat: [0]
- feat_dynamic_real: None
- item_id: T1
- target: [-0.7127609544951682, -0.6743409178438863, -0.3749847989359815, ... 0.12447567753068307, ...]
使用方法
- 可用于Huggingface的Transformer、Autoformer、Informer等算法。
- 其他算法可通过target特征直接提取数据。
搜集汇总
数据集介绍

构建方式
该数据集的构建基于2015至2016年间旧金山湾区高速公路的占有率时间序列数据,涵盖862个数据点,每点代表一个小时的交通情况。数据集通过时间戳标记每个数据点的起始时间,并包含静态类别特征、动态实数特征、时间序列索引以及目标时间序列数据,构建成为一个全面反映交通状况的时序数据集。
特点
数据集的特点在于其细致的时间序列划分,每条记录均包含精确到秒的时间戳,以及分类和实数两种类型的特征,为模型提供了丰富的信息输入。此外,数据集经过标准化预处理,确保了数据质量的一致性,便于模型的训练和评估。数据集分为训练集、验证集和测试集,各包含862个样本,均衡的数据分布有助于模型的泛化能力。
使用方法
使用该数据集时,可以直接通过Huggingface的Transformer、Autoformer、Informer等模型进行加载和应用。用户也可以根据需要,直接提取数据集中的目标特征进行其他算法的模型训练。数据集加载后,用户可以通过Python字典格式的样本进行数据访问和处理,灵活便捷。
背景与挑战
背景概述
LeoTungAnh/traffic_hourly数据集,搜集了2015至2016年间,美国旧金山湾区高速公路的862个道路占用率小时时间序列数据点。该数据集由Leo Tung Anh创建,旨在为智能交通系统研究提供实证基础,其研究成果对于城市交通规划、交通流量预测等领域具有重要的指导意义。
当前挑战
该数据集在构建过程中所遇到的挑战主要涉及数据采集的准确性与完整性,以及如何在保持数据隐私的前提下,确保数据的有效利用。此外,在研究领域中,如何利用该数据集进行高效的时间序列预测,以及如何将预测结果准确应用于实际的交通管理决策,也是当前面临的挑战。
常用场景
经典使用场景
在智能交通系统研究领域,LeoTungAnh/traffic_hourly数据集被广泛用于分析城市道路占用率的变化趋势。该数据集包含了2015至2016年期间,旧金山湾区高速公路的862个时间序列数据点,以每小时为频率进行采样。研究人员可通过此数据集,运用时间序列分析方法,如Transformer、Autoformer或Informer等,对交通流量进行预测。
衍生相关工作
基于该数据集,学术界衍生了诸多相关研究工作,包括但不限于交通流量预测模型的构建与优化、城市交通模式分析、以及交通网络优化算法的研究。这些研究进一步扩展了数据集的应用范围,推动了智能交通系统领域的发展。
数据集最近研究
最新研究方向
在智能交通系统研究领域,LeoTungAnh/traffic_hourly数据集的最新研究方向聚焦于利用时间序列分析预测道路占用率。该数据集涵盖了2015至2016年期间,旧金山湾区高速公路的862个时间序列数据点,每小时更新一次。前沿研究正致力于通过深度学习模型,如Transformer、Autoformer和Informer,对交通流量进行精准预测,旨在优化交通管理和减少拥堵。此类研究不仅为交通规划提供了科学依据,也对应对城市交通挑战具有重要意义。
以上内容由遇见数据集搜集并总结生成



