five

ca-aird/air-traffic-2015-rlr

收藏
Hugging Face2024-07-04 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/ca-aird/air-traffic-2015-rlr
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为`air-traffic-2015-rlr`,涉及2015年美国国内机场的运输网络。机场表示为顶点,航班表示为边。每条边都与一个时间戳(航班日期)和一个特征向量相关联,该特征向量源自出发和到达机场的天气条件。航班延误时间通过航班持续时间进行归一化,作为边的目标,反映了航班延误的结果。任务是根据出发和目的地机场及其在航班计划起飞时的天气条件预测航班延误。数据集创建于2024年7月1日,最近更新于2024年7月1日。数据来源于航班数据和天气数据,分别来自Kaggle和Open-Meteo。数据集包含257个节点、5,138,263条边、20个边特征和334个时间戳。数据格式为压缩的`data.pt`文件,大小为49.1 MB。

This dataset involves a transportation network domestic airports in US during 2015. Airports are represented as vertices and flights as edges. Each edge is associated with a timestamp (flight date) and a feature vector derived from weather conditions at the departure and arrival airports. Arrival delay normalized by flight duration serves as the edge target, reflecting the flight delay outcome. The task is predicting the flight delay given the source and destination airports in addition to their weather conditions at the time of scheduled departure of flight. The dataset was created on 01.07.2024 and last updated on 01.07.2024. The data sources are flight data and weather data from Kaggle and Open-Meteo, respectively. The dataset contains 257 nodes, 5,138,263 edges, 20 edge features, and 334 timestamps. The data format is a compressed `data.pt` file with a size of 49.1 MB.
提供机构:
ca-aird
原始信息汇总

Air Traffic 2015 for Recent Link Regression

概述

  • 名称: air-traffic-2015-rlr
  • 描述: 该数据集涉及2015年美国国内机场的交通网络。机场表示为顶点,航班表示为边。每条边关联一个时间戳(航班日期)和一个从出发和到达机场的天气条件派生的特征向量。到达延迟通过航班持续时间进行归一化,作为边的目标,反映了航班延迟的结果。
  • 任务: 任务是预测给定源和目标机场及其预定起飞时间的天气条件下的航班延迟。
  • 创建日期: 2024年01月07日
  • 最后更新: 2024年01月07日
  • 原始来源:
  • 联系信息: email
  • 许可证: CC BY 4.0

统计信息

类别 数据
节点数量 257
边数量 5,138,263
节点特征数量 0
边特征数量 20
时间戳数量 334

下载

  • 格式: 压缩的 data.pt,包含以下Python字典: python data = { "node_attr": None, "edge_index": torch.LongTensor, "edge_time": torch.FloatTensor, "edge_attr": torch.FloatTensor, "edge_label": torch.FloatTensor, "num_nodes": int }

  • 大小: 49.1 MB

  • 位置: https://huggingface.co/datasets/ca-aird/airtraffic2015/blob/main/data.zip

引用

@article{, title={Benchmarking Edge Regression on Temporal Networks}, author={Muberra Ozmen and Florence Regol and Thomas Markovich}, journal={X}, volume={X}, number={X}, pages={X}, year={X}, publisher={X} }

预处理

  • 原始航班记录字段:

    字段 描述 用途
    Origin 出发机场的IATA代码。 用作源节点
    Dest 目的地机场的IATA代码。 用作目标节点
    Date 预定日期。 用作边时间
    ArrTime 实际到达时间。用于计算边目标,公式为 (ArrTime - CRSArrTime) / (CRSArrTime - CRSDepTime)。 用于计算边目标
    CRSArrTime 预定到达时间。用于计算边目标,公式为 (ArrTime - CRSArrTime) / (CRSArrTime - CRSDepTime)。 用于计算边目标
    CRSDepTime 预定出发时间。用于计算边目标,公式为 (ArrTime - CRSArrTime) / (CRSArrTime - CRSDepTime)。 用于计算边目标
  • 天气条件字段:

    字段 描述 用途
    dest_temperature_2m_max 目的地2米高度的最高日气温。 用作边特征
    dest_temperature_2m_min 目的地2米高度的最低日气温。 用作边特征
    dest_temperature_2m_mean 目的地2米高度的平均日气温。 用作边特征
    dest_precipitation_sum 目的地的日降水量总和(包括雨、阵雨和降雪)。 用作边特征
    dest_rain_sum 目的地的日降雨量总和。 用作边特征
    dest_snowfall_sum 目的地的日降雪量总和。 用作边特征
    dest_wind_speed_10m_max 目的地的最大风速。 用作边特征
    dest_wind_gusts_10m_max 目的地的最大阵风速度。 用作边特征
    dest_wind_direction_10m_dominant 目的地的风向。 用作边特征
    origin_temperature_2m_max 出发地2米高度的最高日气温。 用作边特征
    origin_temperature_2m_min 出发地2米高度的最低日气温。 用作边特征
    origin_temperature_2m_mean 出发地2米高度的平均日气温。 用作边特征
    origin_precipitation_sum 出发地的日降水量总和(包括雨、阵雨和降雪)。 用作边特征
    origin_rain_sum 出发地的日降雨量总和。 用作边特征
    origin_snowfall_sum 出发地的日降雪量总和。 用作边特征
    origin_wind_speed_10m_max 出发地的最大风速。 用作边特征
    origin_wind_gusts_10m_max 出发地的最大阵风速度。 用作边特征
    origin_wind_direction_10m_dominant 出发地的风向。 用作边特征
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作