airline-satisfaction-analysis
收藏Hugging Face2025-11-18 更新2025-11-19 收录
下载链接:
https://huggingface.co/datasets/drukeroni/airline-satisfaction-analysis
下载链接
链接失效反馈官方服务:
资源简介:
航空乘客满意度数据集,包含超过10万名乘客的数据,包括乘客人口统计信息(年龄、性别、旅行类型)、航班信息(距离、延误、航班等级)、服务评分(座位舒适度、娱乐、餐饮、在线登机等)和满意度标签(满意、中立或不满意)。
创建时间:
2025-11-17
原始信息汇总
Airline Passenger Satisfaction Analysis 数据集概述
数据集基本信息
- 标题: Airline Passenger Satisfaction Analysis
- 许可证: mit
- 标签: dataset, airlines, satisfaction, analysis, kaggle
- 数据规模: 超过100,000名乘客
数据集内容
- 乘客人口统计信息(年龄、性别、旅行类型)
- 航班信息(距离、延误、舱位等级)
- 服务评分(座椅舒适度、娱乐设施、餐饮服务、在线登机等)
- 满意度标签(满意/中立或不满意)
关键分析问题
- 整体满意度水平
- 旅行类型(个人vs商务)对满意度的影响
- 航班舱位等级的重要性
- 最能预测满意度的服务因素
- 延误对满意度的影响
主要发现
满意度分布
- 大多数乘客报告"中立或不满意"
- 理解满意度驱动因素至关重要
旅行类型分析
- 商务旅行者满意度显著更高
- 个人旅行者大多不满意
- 旅行目的强烈影响体验
航班舱位分析
- 商务舱满意度最高
- 经济舱满意度最低
- 服务水平与满意度密切相关
关键预测因素
强预测因子:
- 在线登机
- 机上娱乐
- 座椅舒适度
- 机上服务
- 腿部空间服务
弱预测因子:
- 飞行距离
- 延误(几乎无相关性)
总结要点
- 整体满意度水平较低
- 旅行目的在满意度中起主要作用
- 商务舱提供显著更好的客户体验
- 最佳预测因素是在线登机、座椅舒适度和娱乐设施
- 延误对满意度没有强烈影响
- 改善服务体验具有最大影响
技术栈
- Python
- Pandas
- NumPy
- Matplotlib
- Seaborn
可视化图表
- https://cdn-uploads.huggingface.co/production/uploads/691b04764459ccdf9ed3fbc5/PHcbjKxcNU3FL2Wauug2-.png
- https://cdn-uploads.huggingface.co/production/uploads/691b04764459ccdf9ed3fbc5/INJPyiZfElurZL-qMotoa.png
- https://cdn-uploads.huggingface.co/production/uploads/691b04764459ccdf9ed3fbc5/t8FIlW9tP8B4wic7WN349.png
- https://cdn-uploads.huggingface.co/production/uploads/691b04764459ccdf9ed3fbc5/xmcpKK_hayqWyUP8ekdvy.png
搜集汇总
数据集介绍

构建方式
在航空服务研究领域,该数据集通过系统采集乘客反馈构建而成,涵盖超过十万名旅客的完整乘机体验记录。数据收集过程整合了旅客人口统计特征、航班基本信息以及多维度的服务评价指标,采用结构化问卷与自动化数据提取相结合的方式,确保信息采集的全面性与准确性。每个样本均包含从值机到抵达的全流程服务评分,并最终归纳为满意或不满意的二元分类标签,为服务质量研究提供了扎实的数据基础。
使用方法
研究人员可借助该数据集开展多元化的航空服务质量分析,首要步骤是通过探索性分析揭示不同客群满意度的影响机制。具体操作可先从人口统计学特征与航班类型的交叉分析入手,继而运用相关性分析识别关键服务驱动因素。机器学习领域可将其作为分类任务的典型样本,通过特征工程提取服务评价指标与满意度标签的潜在关联,最终构建预测模型为航空公司的服务优化提供数据支撑。
背景与挑战
背景概述
航空旅客满意度分析数据集诞生于现代航空服务业精细化管理的需求背景下,由Reichman大学数据科学团队于2020年代初期构建。该数据集聚焦于探究航空服务质量与乘客满意度之间的复杂关联机制,核心研究目标在于识别影响旅客体验的关键服务维度。通过采集超过十万名乘客的旅行特征、服务评价及满意度标签,该资源为航空运营优化提供了实证基础,推动了客户体验管理从定性描述向量化分析的范式转变。
当前挑战
在解决航空服务优化问题的过程中,该数据集面临多重挑战:首先需要精准量化主观性极强的乘客满意度指标,避免情感偏差对分类结果的影响;其次需处理高维度服务特征间的多重共线性问题,例如在线登机与机上娱乐服务的交互效应。数据构建阶段面临航班延误记录与实时服务评价的时间异步性难题,同时商务旅客与休闲旅客的异质性行为模式要求设计分层采样策略以确保样本代表性。
常用场景
经典使用场景
在航空服务研究领域,该数据集常被用于构建客户满意度预测模型。研究人员通过整合乘客人口统计特征、航班信息及多维度服务评分,运用机器学习算法识别影响满意度的关键驱动因素。这种分析范式不仅揭示了服务要素间的内在关联,更为航司优化资源配置提供了量化依据。
解决学术问题
该数据集有效解决了服务质量管理中的归因分析难题,通过实证数据验证了霍姆斯特德服务差距理论在航空场景的适用性。其价值在于突破了传统问卷调查的局限性,以十万级样本量证实了服务接触点对满意度的非线性影响,为服务质量度量体系提供了新的方法论支撑。
实际应用
航空企业借助该数据集构建了精准化的服务改进体系。通过识别在线登机、座椅舒适度等核心影响因子,航司可针对不同客群实施差异化服务策略。例如商务舱旅客更关注娱乐系统质量,而经济舱乘客则对腿部空间更为敏感,这种洞察直接指导了机上服务设施的迭代升级。
数据集最近研究
最新研究方向
在航空服务满意度研究领域,当前前沿聚焦于多模态数据融合与动态预测模型的构建。基于该数据集揭示的在线登机、座椅舒适度等核心影响因素,研究者正探索将文本评论、实时传感器数据与结构化评分相结合,通过图神经网络捕捉服务要素间的隐性关联。随着航空业数字化转型加速,相关研究已延伸至个性化服务推荐系统的开发,利用联邦学习技术在保护用户隐私的前提下实现跨航空公司知识迁移。这些进展不仅推动了服务质量评估范式的革新,更为航空业后疫情时代的精准运营提供了决策支持。
以上内容由遇见数据集搜集并总结生成



