AeroSCOPE
收藏github2024-04-17 更新2024-05-31 收录
下载链接:
https://github.com/AeroMAPS/AeroSCOPE_dataset
下载链接
链接失效反馈官方服务:
资源简介:
AeroSCOPE项目旨在整合各种航空运输的公开数据源,以更好地理解航空运输的地理分布。该项目收集所有公开源的航空交通数据,构建一个特定年份(2019年)的扩展航空交通路线数据库。
The AeroSCOPE project aims to integrate various publicly available data sources related to air transportation to better understand the geographical distribution of air transport. The project collects air traffic data from all publicly available sources to build an extensive air traffic route database for a specific year (2019).
创建时间:
2023-09-29
原始信息汇总
AeroSCOPE数据集概述
数据集目的
AeroSCOPE项目旨在整合多种航空运输的开放数据源,以更好地理解航空运输的地理分布。
数据集内容
- 数据收集与处理:数据集通过收集所有开放源的航空交通数据,构建了一个扩展的航空交通路线数据库,主要针对2019年。数据收集过程包括自动解析维基百科机场页面以获取航线网络信息,并将这些信息与开放源数据合并,使用回归器进行训练,估计剩余航线的交通量(座位供应量),最终将所有数据源聚合为一个文件。
- 数据集结构:数据集包含多个部分,分别用于解析维基百科数据、添加机场特征、编译航线数据以及进行数据测试和应用。
数据集使用
- 简单使用:用户可以直接使用图形界面或下载最终数据库,无需外部输入。
- 高级使用:用户可以运行所有数据收集和处理笔记本,需要外部数据输入,这些数据因过大或分布受限而未存储在Git中。
数据集访问
- 图形界面:用户可以通过访问www.aeromaps.eu/aeroscope或通过终端导航到04_app文件夹并使用voila运行应用。
- 原始数据库CSV文件:用户可以在zenodo下载最新版本的处理数据库,DOI为10.5281/zenodo.10143773,确保下载v1.0.1版本。
数据集许可
AeroSCOPE数据集根据GPL-3.0许可发布。对于非学术框架内的使用案例,请联系数据集维护者。
搜集汇总
数据集介绍

构建方式
AeroSCOPE数据集的构建方式融合了多种开放数据源,旨在全面理解航空运输的地理分布。该数据集通过整合来自不同开放数据源的航空运输信息,特别是2019年的数据,构建了一个扩展的航空交通路线数据库。由于部分地区的数据覆盖有限,项目开发了一种方法,通过自动解析维基百科机场页面来获取机场的航线网络信息,并结合开放数据源进行数据估计和回归分析,最终将所有数据源聚合为一个综合文件。
特点
AeroSCOPE数据集的显著特点在于其多源数据的整合与估计方法。该数据集不仅包含了来自多个开放数据源的原始数据,还通过维基百科的自动解析和回归模型估计了缺失的航线数据,特别是在数据覆盖不足的地区。此外,数据集还提供了详细的处理和估计过程,使得用户可以复现和验证数据处理步骤,增强了数据的可信度和透明度。
使用方法
AeroSCOPE数据集提供了两种使用方式:简单使用和高级使用。简单使用允许用户通过图形界面或直接下载处理后的数据库进行探索,无需额外输入。高级使用则涉及运行所有数据收集和处理笔记本,需要外部数据输入,适合深入研究和数据复现。用户可以通过conda虚拟环境安装所需包,并根据提供的笔记本进行数据处理和分析。此外,数据集还提供了详细的文档和代码,帮助用户理解和使用数据。
背景与挑战
背景概述
AeroSCOPE数据集由Antoine Salgas和Junzi Sun主导开发,旨在整合多种开放的航空运输数据源,以深入理解航空运输的地理分布。该数据集的核心研究问题聚焦于如何通过整合全球开放的航空数据,构建一个扩展的2019年航空交通路线数据库。AeroSCOPE的创建不仅填补了亚洲-太平洋、南美和非洲等地区航空数据覆盖不足的空白,还通过自动解析维基百科机场页面,结合回归分析方法,估算了未知航线的客流量。这一研究对航空运输领域的数据分析和建模具有重要意义,尤其在提升全球航空交通数据的完整性和准确性方面。
当前挑战
AeroSCOPE数据集在构建过程中面临多项挑战。首先,全球航空数据的多样性和不均衡性使得数据整合异常复杂,尤其是亚洲-太平洋、南美和非洲等地区的数据覆盖有限。其次,自动解析维基百科页面以获取机场和航线信息的过程易受页面更新影响,导致数据一致性问题。此外,由于部分数据源(如Eurocontrol和OpenSky)的限制,数据获取和处理过程需要额外的技术手段和许可。最后,数据集的构建涉及大量外部数据输入和复杂的预处理步骤,这增加了数据集的使用门槛和维护难度。
常用场景
经典使用场景
AeroSCOPE数据集的经典使用场景在于其能够整合多种开放的航空运输数据源,帮助研究者深入分析全球航空运输的地理分布。通过该数据集,用户可以探索2019年的航空交通路线数据库,并利用其提供的图形界面直观地查看和分析数据。此外,数据集还支持高级用户通过运行数据收集和处理笔记本,进一步定制和扩展数据集内容,以满足更复杂的分析需求。
解决学术问题
AeroSCOPE数据集解决了航空运输领域中关于数据覆盖不全的学术问题。由于现有开放数据源在亚太、南美和非洲等地区的覆盖有限,该数据集通过自动解析维基百科机场页面,结合回归模型估计缺失的交通数据,从而构建了一个全面的航空交通路线数据库。这一方法不仅填补了数据空白,还为全球航空运输的研究提供了更为全面和准确的数据支持。
衍生相关工作
AeroSCOPE数据集的发布催生了一系列相关研究工作。例如,基于该数据集的航空交通网络分析,研究者们提出了新的航线优化算法和机场容量评估模型。此外,数据集的开放性还激发了其他领域的研究,如利用航空数据进行城市间经济联系分析和全球物流网络优化。这些衍生工作不仅扩展了数据集的应用范围,还为航空运输领域的研究提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成



