PeMS04, PeMS07, PeMS08, NYCTaxi|交通流量预测数据集|数据可视化数据集
收藏数据集概述
数据集名称
- Drive Me Crazy
技术细节
- 提交文件: dataset_analysis.ipynb, presentation.txt, lookerstudio_url.txt, drive_me_crazy_tradi.ipynb, drive_me_crazy_pdformer.ipynb
- 编程语言: 根据所参与的Bootcamp决定,如JavaScript, Ruby, Python, Java, C++, Rust等。
项目目标
- 开发一个基于“Propagation Delay-Aware Dynamic Long-Range Transformer”方法的交通流量预测系统。
- 使用PeMS04, PeMS07, PeMS08, 和 NYCTaxi数据集预测城市地区的交通流量模式。
- 开发一个使用Looker Studio的交互式仪表板,用于可视化和展示交通流量预测。
方法论
- 数据集成: 合并PeMS04, PeMS07, PeMS08, 和 NYCTaxi数据集。
- 数据预处理: 清洗、聚合和预处理数据。
- 模型适应: 定制“Propagation Delay-Aware Dynamic Long-Range Transformer”模型。
- 模型训练: 使用适当的数据科学库训练模型。
- 模型评估: 使用MAE和RMSE等指标评估模型。
- 比较分析: 比较新模型与传统交通预测方法的性能。
- 延迟影响分析: 分析传播延迟对交通流量预测准确性的影响。
- Transformer效率分析: 评估动态长范围Transformer在捕捉不同数据集上交通模式的有效性。
交付物
- 数据集分析报告。
- 传统交通流量预测模型(Jupyter notebook)。
- “Propagation Delay-Aware Dynamic Long-Range Transformer”模型实现(Jupyter notebook)。
- 传播延迟对交通流量预测准确性影响的分析报告。
- 使用Looker Studio的交互式仪表板。
- 模型性能比较报告。
- 动态长范围Transformer在捕捉城市交通模式效率的洞察报告。

THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
RadDet
RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。
github 收录
WeChat Social Network Dataset
该数据集包含了微信社交网络的用户关系数据,包括用户之间的关注关系、互动行为等。数据集旨在帮助研究社交网络的结构和动态变化。
www.aminer.cn 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录