five

XXLTraffic|智能交通数据集|长期交通预测数据集

收藏
arXiv2024-06-18 更新2024-06-20 收录
智能交通
长期交通预测
下载链接:
https://github.com/cruiseresearchgroup/XXLTraffic
下载链接
链接失效反馈
资源简介:
XXLTraffic数据集是由新南威尔士大学创建,旨在解决智能交通系统中超动态和极长预测问题。该数据集包含长达23年的交通数据,涵盖9个区域,支持时间和空间上的扩展挑战。数据集通过加州交通部性能测量系统(PeMS)收集,包含详细的传感器数据和元数据。XXLTraffic不仅支持传统的时间序列预测,还引入了时间间隔和降采样设置,以模拟实际交通预测中的复杂情况。此数据集的应用领域广泛,特别是在城市基础设施规划和道路管理中,为长期交通预测提供了强大的数据支持。
提供机构:
新南威尔士大学
创建时间:
2024-06-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
XXLTraffic数据集的构建基于加利福尼亚州交通部(CalTrans)的性能测量系统(PeMS),该系统通过分布在加州高速公路上的19,561个传感器收集交通数据。研究人员从2001年至2024年3月期间,下载了九个区域的原始数据,并进行了严格的数据过滤和聚合。为了支持极长预测任务,数据集特别选择了早期安装并持续收集数据的传感器子集,形成了包含时间间隔和空间节点扩展的交通数据。数据预处理包括每小时和每日的聚合,以支持不同时间尺度的预测任务。
特点
XXLTraffic数据集的特点在于其极长的时间跨度和不断扩展的空间节点。数据集涵盖了23年的时间跨度,并且随着时间的推移,传感器节点的数量不断增加,反映了真实世界中交通基础设施的动态变化。此外,数据集还包含了时间间隔和传感器数据缺失的情况,模拟了实际交通预测中的复杂场景。这些特点使得XXLTraffic能够支持极长预测任务,并为研究超动态交通预测提供了丰富的实验环境。
使用方法
XXLTraffic数据集的使用方法包括极长预测、小时级和日级预测任务。数据集提供了标准的时间序列预测设置,并引入了时间间隔和训练数据下采样的新配置,以更好地模拟实际约束。研究人员可以通过数据集中的时间间隔设置,探索极长预测任务中的时间分布变化。此外,数据集还支持零样本预测任务,允许研究人员在新增传感器上进行预测。数据集的使用不仅限于传统的交通预测模型,还可以为基于深度学习的时空模型提供新的研究方向。
背景与挑战
背景概述
XXLTraffic数据集由新南威尔士大学的研究团队于2024年提出,旨在解决交通预测领域中的超动态和超长期预测问题。该数据集是目前公开的最大交通数据集,涵盖了长达23年的时间跨度,并包含了逐年增加的传感器节点。XXLTraffic的创建背景源于现有交通数据集在反映真实世界超动态特性方面的局限性,如基础设施的持续演变、时间分布的变化以及传感器故障或交通模式变化导致的时间间隔。该数据集不仅支持传统的时间序列预测任务,还引入了时间间隔和训练数据下采样等新颖配置,以更好地模拟实际约束。XXLTraffic的发布为交通预测和时间序列分析领域提供了新的研究视角,并为开发应对超动态和超长期预测问题的模型提供了强大的平台。
当前挑战
XXLTraffic数据集在构建和应用过程中面临多重挑战。首先,交通预测领域本身具有高度复杂性,尤其是在超动态和超长期预测任务中,模型需要处理基础设施的持续演变、时间分布的变化以及传感器数据的不连续性。其次,数据集的构建过程中,研究人员需要应对传感器节点的逐年增加以及数据采集过程中的时间间隔问题,这要求对数据进行严格的筛选和聚合。此外,由于数据集的时间跨度长达23年,城市基础设施的发展和道路建设可能导致交通模式的显著变化,这种时间域的变化对模型的适应性提出了更高的要求。最后,XXLTraffic的庞大规模也对计算资源提出了更高的需求,尤其是在处理超长期预测任务时,模型的训练和推理过程需要更多的计算资源和时间。
常用场景
经典使用场景
XXLTraffic数据集在交通预测领域具有广泛的应用,尤其是在超动态和极长时间跨度的预测任务中。该数据集通过提供长达23年的交通数据,涵盖了多个传感器节点的增长和变化,能够支持从小时级到天级的多种时间尺度预测任务。其经典使用场景包括城市交通流量预测、高速公路规划以及智能交通系统的优化。通过引入时间间隔和训练数据下采样,XXLTraffic能够更好地模拟现实世界中的复杂交通动态,为研究者提供了一个强有力的工具来应对超动态预测挑战。
解决学术问题
XXLTraffic数据集解决了现有交通预测数据集中存在的多个学术问题。首先,它弥补了现有数据集在时间跨度和空间覆盖上的不足,提供了长达23年的数据,能够支持极长时间的预测任务。其次,该数据集通过引入时间间隔和传感器节点的动态增长,模拟了现实世界中交通基础设施的持续变化,帮助研究者更好地应对数据分布随时间变化的问题。此外,XXLTraffic还支持零样本预测任务,为处理新传感器数据的预测问题提供了新的研究方向。这些特性使得XXLTraffic成为交通预测领域的一个重要资源,推动了超动态预测模型的发展。
衍生相关工作
XXLTraffic数据集的发布催生了一系列相关研究工作。首先,基于该数据集的研究推动了超动态预测模型的发展,许多研究者提出了新的深度学习架构,如基于Transformer的变体和图神经网络(GNN),以应对极长时间跨度和动态变化的挑战。其次,XXLTraffic为零样本预测任务提供了新的研究方向,研究者们提出了多种迁移学习和持续学习框架,以处理新传感器数据的预测问题。此外,该数据集还激发了关于时间序列分解和多尺度预测的研究,许多工作探索了如何从极长时间序列中提取有效的时空模式。这些衍生工作不仅丰富了交通预测领域的研究内容,也为其他时间序列预测任务提供了新的思路。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录