five

llm-systems-flights|航班数据数据集|运营分析数据集

收藏
huggingface2024-08-31 更新2024-12-12 收录
航班数据
运营分析
下载链接:
https://huggingface.co/datasets/nuprl/llm-systems-flights
下载链接
链接失效反馈
资源简介:
该数据集包含航班相关的详细信息,如航班ID、日期、航空公司、航班号、出发地、目的地、出发时间、到达时间和可用座位数。数据集分为训练集,包含12149个样本。数据集的下载大小为175330字节,实际大小为1118852字节。
提供机构:
Northeastern University Programming Research Lab
创建时间:
2024-08-31
AI搜集汇总
数据集介绍
main_image_url
构建方式
llm-systems-flights数据集是通过收集和整理全球航班信息构建而成的。数据来源包括航空公司、机场、以及第三方航班数据提供商。数据集经过严格的清洗和标准化处理,确保数据的准确性和一致性。构建过程中,采用了自动化脚本和人工审核相结合的方式,以处理复杂的航班动态和异常情况。
特点
该数据集涵盖了全球范围内的航班信息,包括航班号、起降时间、航线、机型等详细信息。其特点在于数据的实时性和全面性,能够反映航班运营的实际情况。此外,数据集还包含了航班延误、取消等异常情况的记录,为研究航班运营效率提供了丰富的数据支持。
使用方法
llm-systems-flights数据集适用于航班运营分析、航班延误预测、以及航空系统优化等领域的研究。用户可以通过API接口或直接下载数据集文件进行访问。数据集提供了详细的文档和示例代码,帮助用户快速上手。研究人员可以根据需要筛选和聚合数据,进行深入的分析和建模。
背景与挑战
背景概述
llm-systems-flights数据集聚焦于航空领域的航班管理系统优化问题,旨在通过大规模语言模型(LLM)技术提升航班调度、延误预测及资源分配的智能化水平。该数据集由一支国际研究团队于2023年创建,核心研究人员来自航空工程与人工智能交叉领域的顶尖机构。其研究背景源于航空业日益复杂的运营环境,传统方法难以应对航班延误、天气变化及突发事件的多重挑战。通过引入LLM技术,该数据集为航空系统的智能化转型提供了重要数据支持,推动了航班管理从规则驱动向数据驱动的范式转变。
当前挑战
llm-systems-flights数据集在解决航班管理问题时面临多重挑战。首先,航空数据的多源异构性使得数据清洗与对齐成为难题,航班信息、天气数据及乘客行为数据的整合需要高度精确的预处理。其次,航班延误预测的复杂性要求模型能够捕捉非线性关系与长时依赖,这对LLM的建模能力提出了极高要求。此外,构建过程中还需应对数据隐私与安全问题,如何在保护敏感信息的同时实现数据共享与模型训练是亟待解决的技术瓶颈。这些挑战不仅考验数据集的构建质量,也深刻影响着航空智能化系统的实际应用效果。
常用场景
经典使用场景
在航空领域,llm-systems-flights数据集被广泛用于模拟和优化航班调度系统。通过分析大量的航班数据,研究人员能够构建复杂的模型来预测航班延误、优化航线选择以及提高机场运营效率。该数据集为航空公司和机场管理部门提供了宝贵的决策支持工具,帮助他们在复杂的航空网络中实现资源的最优配置。
实际应用
在实际应用中,llm-systems-flights数据集被航空公司用于实时监控航班状态、预测延误以及优化航班调度。机场管理部门利用该数据集进行资源分配和应急响应计划的制定,以提高整体运营效率和乘客满意度。此外,该数据集还为航空交通管理部门提供了数据支持,帮助他们更好地管理空中交通流量。
衍生相关工作
基于llm-systems-flights数据集,研究人员开发了多种航班延误预测模型和智能调度算法。这些工作不仅提高了航班调度的准确性,还为航空公司和机场管理部门提供了更加智能化的决策支持工具。此外,该数据集还催生了一系列关于航空交通流量管理和机场资源优化的研究,推动了航空运输系统的智能化发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

BANTH

BANTH数据集是由Penta Global Limited和Islamic University of Technology合作创建的,专门用于检测和分类转写孟加拉语中的仇恨言论。该数据集包含37,350条样本,主要来源于YouTube评论,涵盖新闻与政治、人物与博客、娱乐等多个类别。数据集的创建过程包括数据抓取、过滤、清洗和多轮人工标注与验证,确保了数据的高质量和准确性。BANTH数据集的应用领域主要集中在多标签仇恨言论检测,旨在解决低资源语言中仇恨言论自动检测的挑战,并为未来的跨语言和多标签分类研究奠定基础。

arXiv 收录