five

NGAFID Aviation Maintenance Dataset

收藏
arXiv2022-10-14 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.6624956 and https://www.kaggle.com/datasets/hoong/aviation-maintenance-dataset-from-the-ngafid
下载链接
链接失效反馈
官方服务:
资源简介:
NGAFID航空维护数据集是由罗切斯特理工学院的研究人员创建的大型公开可用数据集,包含31,177小时的飞行数据,涵盖28,935次飞行,与2,111次未计划的维护事件相关。数据集通过国家通用航空飞行信息数据库(NGAFID)收集,包含不同季节、天气条件、飞行员和飞行模式下的真实飞行记录和维护日志。数据集大小超过4.3GB,包含超过1亿行飞行数据,由23个传感器每秒记录。该数据集主要用于机器学习研究,特别是在时间序列分类和时间序列异常检测领域,旨在解决预测维护系统中的挑战,提高航空安全性。

The NGAFID Aviation Maintenance Dataset is a large, publicly available dataset created by researchers at the Rochester Institute of Technology. It contains 31,177 hours of flight data covering 28,935 flights, which are associated with 2,111 unplanned maintenance events. The dataset is collected via the National General Aviation Flight Information Database (NGAFID), and includes real flight records and maintenance logs under diverse conditions including different seasons, weather conditions, pilots, and flight modes. With a total size exceeding 4.3 GB, the dataset contains over 100 million rows of flight data recorded by 23 sensors per second. This dataset is primarily intended for machine learning research, particularly in the fields of time series classification and time series anomaly detection, aiming to address challenges in predictive maintenance systems and enhance aviation safety.
提供机构:
罗切斯特理工学院
创建时间:
2022-10-14
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建方式主要依赖于国家通用航空飞行信息数据库(NGAFID)中的飞行记录以及维护日志。通过分析2,111次计划外维护事件,将其分类为36种维护问题,并将飞行数据标注为维护前或维护后。由于实际操作中收集数据来评估预测维护系统的难度较大,该数据集利用NGAFID数据库中的真实飞行记录和维护日志,克服了这一挑战。
特点
NGAFID航空维护数据集的特点在于其包含的真实飞行记录和维护日志,这些数据涵盖了不同的季节、天气条件、飞行员和飞行模式。与以往使用模拟数据或实验室环境生成的数据集不同,该数据集提供了真实的、未经处理的飞行记录,为机器学习研究人员提供了宝贵的测试和发展预测性健康管理的机会。
使用方法
使用NGAFID航空维护数据集的方法包括下载Python代码以轻松获取数据集,以及使用Colab环境复制三个不同模型的基准。此外,还提供了包含帮助代码的存储库,用于自动下载和处理数据集,以及用于复制基准实验的两个Colab笔记本。用户可以通过在Web浏览器中运行Colab笔记本来运行基准实验,无需考虑硬件和软件配置。
背景与挑战
背景概述
NGAFID Aviation Maintenance Dataset是迄今为止最大的公开可用的、非模拟的、针对整个机队的飞机飞行记录和维护日志数据集,用于预测部件故障和维护需求。该数据集由香港杨和特拉维斯·德塞尔在2022年10月13日发布,包含28,935次飞行中收集的31,177小时的飞行数据,这些飞行与2,111次计划外维护事件相关,这些事件被分为36种维护问题类型。该数据集的独特之处在于它包含了不同季节、天气条件、飞行员和飞行模式下的真实飞行记录和维护日志,为机器学习研究人员提供了测试和发展预测性健康管理系统(PHM)的机会。此外,该数据集还提供了Python代码和Colab环境,方便研究人员下载数据集并复现实验结果。
当前挑战
NGAFID Aviation Maintenance Dataset的构建和应用面临着多方面的挑战。首先,该数据集所解决的领域问题是预测性维护,这要求模型能够准确预测飞机部件的剩余使用寿命(RUL),并检测潜在的故障。其次,构建该数据集的过程本身就充满挑战,因为收集数据来评估预测性维护系统是非常困难的,从性能受损的飞机中生成数据既危险又不道德。为了克服这一难题,研究人员使用了国家通用航空飞行信息数据库(NGAFID),该数据库包含了在飞机正常运营期间记录的飞行数据,并利用维护日志来构建部件故障数据集。最后,该数据集对机器学习研究人员提出了一个难题,特别是在时间序列分类和时间序列异常检测方面。由于飞机传感器的特性,该数据集尤其具有挑战性,因为通用航空飞机的传感器数量有限,且飞行数据的很大一部分变化是由飞行员的行为造成的,而不是飞机部件的状态。这使得传统的预测性维护方法难以应用,需要开发新的模型和算法来应对这些挑战。
常用场景
经典使用场景
NGAFID Aviation Maintenance Dataset 作为预测飞机部件故障和维护需求的大型数据集,被广泛应用于飞机健康管理系统(PHM)的研究中。该数据集包含了 31,177 小时的飞行数据,跨越 28,935 次飞行,其中涉及 2,111 次非计划性维护事件,这些事件被归类为 36 种维护问题类型。飞行数据被标注为维护前后,部分飞行发生在维护当天。该数据集为机器学习研究人员提供了挑战性的任务,即预测飞机部件的剩余使用寿命(RUL),并考虑部件 RUL 大于 2 天的概率。与使用模拟数据或实验室环境生成的先前数据集不同,NGAFID Aviation Maintenance Dataset 包含来自不同季节、天气条件、飞行员和飞行模式的真实飞行记录和维护日志。此外,还提供了 Python 代码以轻松下载数据集,以及 Colab 环境以在三种不同的模型上重现基准测试。
解决学术问题
NGAFID Aviation Maintenance Dataset 解决了 PHM 领域中数据收集的难题。由于在实际操作中收集数据既困难、危险又不道德,因此难以生成来自受损飞机的数据。为了克服这一挑战,该数据集使用了国家通用航空飞行信息数据库(NGAFID),该数据库包含在飞机正常操作期间记录的飞行数据和维护日志。这使得研究人员能够在不损害飞行员安全的情况下,对预测维护系统进行评估。该数据集的发布为 PHM 领域的研究提供了宝贵的资源,并推动了预测维护技术的发展。
衍生相关工作
NGAFID Aviation Maintenance Dataset 衍生了许多相关的研究工作,包括:1)使用该数据集进行时间序列分类和异常检测的研究;2)使用该数据集进行数据不平衡问题的研究;3)使用该数据集进行对比表示学习的研究;4)使用该数据集进行迁移学习的研究。这些研究工作推动了 PHM 领域的发展,并为机器学习研究人员提供了宝贵的资源。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作