five

ca-aird/air-traffic-2019-rlr

收藏
Hugging Face2024-07-04 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/ca-aird/air-traffic-2019-rlr
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集涉及2019年美国国内机场的运输网络,其中机场表示为顶点,航班表示为边。每条边都与一个时间戳(航班日期)和一个特征向量相关联,该特征向量由出发和到达机场的天气条件派生而来。目标是通过航班持续时间归一化的到达延误,反映航班延误结果。任务是根据出发和目的地机场及其在航班计划起飞时的天气条件预测航班延误。数据集包含274个节点、484,551条边、20个边特征和181个时间戳。数据格式为压缩的`data.pt`文件,包含一个Python字典。数据集来源于航班数据和天气数据,并提供了详细的预处理信息和引用信息。

This dataset involves a transportation network of domestic airports in the US during 2019. Airports are represented as vertices and flights as edges. Each edge is associated with a timestamp (flight date) and a feature vector derived from weather conditions at the departure and arrival airports. The target is the arrival delay normalized by flight duration, reflecting the flight delay outcome. The task is to predict the flight delay given the source and destination airports and their weather conditions at the time of scheduled departure. The dataset contains 274 nodes, 484,551 edges, 20 edge features, and 181 timestamps. The data format is a compressed `data.pt` file containing a Python dictionary. The dataset is sourced from flight data and weather data, with detailed preprocessing information and citation provided.
提供机构:
ca-aird
原始信息汇总

Air Traffic 2019 for Recent Link Regression

概述

  • 名称: air-traffic-2019-rlr
  • 描述: 该数据集涉及2019年美国国内机场的交通网络。机场表示为顶点,航班表示为边。每条边都关联一个时间戳(航班日期)和一个从出发和到达机场的天气条件中提取的特征向量。到达延迟通过航班持续时间进行归一化,作为边的目标,反映了航班延迟的结果。
  • 任务: 任务是根据源机场和目的机场以及它们的天气条件预测航班延迟。
  • 创建日期: 2024年01月07日
  • 最后更新: 2024年01月07日
  • 原始来源:
  • 联系信息: email
  • 许可证: CC BY 4.0

统计信息

类别 数据
节点数量 274
边数量 484,551
节点特征数量 0
边特征数量 20
时间戳数量 181

下载

  • 格式: 压缩的data.pt文件,包含以下Python字典: python data = { "node_attr": None, "edge_index": torch.LongTensor, "edge_time": torch.FloatTensor, "edge_attr": torch.FloatTensor, "edge_label": torch.FloatTensor, "num_nodes": int }

  • 大小: 7.4 MB

  • 位置: https://huggingface.co/datasets/ca-aird/airtraffic2019/blob/main/data.zip

引用

@article{, title={Benchmarking Edge Regression on Temporal Networks}, author={Muberra Ozmen and Florence Regol and Thomas Markovich}, journal={X}, volume={X}, number={X}, pages={X}, year={X}, publisher={X} }

预处理

  • 原始航班记录字段:

    字段 描述 用途
    Origin 出发机场的IATA代码。 用作源节点
    Dest 目的机场的IATA代码。 用作目的节点
    Date 计划日期。 用作边时间
    ArrTime 实际到达时间。用于计算边目标,公式为 (ArrTime - CRSArrTime) / (CRSArrTime - CRSDepTime)。 用于计算边目标
    CRSArrTime 计划到达时间。用于计算边目标,公式为 (ArrTime - CRSArrTime) / (CRSArrTime - CRSDepTime)。 用于计算边目标
    CRSDepTime 计划出发时间。用于计算边目标,公式为 (ArrTime - CRSArrTime) / (CRSArrTime - CRSDepTime)。 用于计算边目标
  • 天气条件字段:

    字段 描述 用途
    dest_temperature_2m_max 目的地2米高处的最高日气温。 用作边特征
    dest_temperature_2m_min 目的地2米高处的最低日气温。 用作边特征
    dest_temperature_2m_mean 目的地2米高处的平均日气温。 用作边特征
    dest_precipitation_sum 目的地的日降水量总和(包括雨、阵雨和降雪)。 用作边特征
    dest_rain_sum 目的地的日降雨量总和。 用作边特征
    dest_snowfall_sum 目的地的日降雪量总和。 用作边特征
    dest_wind_speed_10m_max 目的地的最大风速。 用作边特征
    dest_wind_gusts_10m_max 目的地的最大风速。 用作边特征
    dest_wind_direction_10m_dominant 目的地的风向。 用作边特征
    origin_temperature_2m_max 出发地2米高处的最高日气温。 用作边特征
    origin_temperature_2m_min 出发地2米高处的最低日气温。 用作边特征
    origin_temperature_2m_mean 出发地2米高处的平均日气温。 用作边特征
    origin_precipitation_sum 出发地的日降水量总和(包括雨、阵雨和降雪)。 用作边特征
    origin_rain_sum 出发地的日降雨量总和。 用作边特征
    origin_snowfall_sum 出发地的日降雪量总和。 用作边特征
    origin_wind_speed_10m_max 出发地的最大风速。 用作边特征
    origin_wind_gusts_10m_max 出发地的最大风速。 用作边特征
    origin_wind_direction_10m_dominant 出发地的风向。 用作边特征
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作