five

Skytrax User Reviews Dataset

收藏
github2024-04-03 更新2024-05-31 收录
下载链接:
https://github.com/quankiquanki/skytrax-reviews-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
一个从Skytrax网站上抓取的用户评论数据集,包含航空公司的评论、机场评论、座位评论和休息室评论。数据集分为四个CSV文件,每个文件对应一个类别。

A dataset of user reviews scraped from the Skytrax website, containing reviews of airlines, airports, seat reviews, and lounge reviews. The dataset is divided into four CSV files, each corresponding to one category.
创建时间:
2015-08-11
原始信息汇总

Skytrax User Reviews Dataset (August 2nd, 2015)

数据集概述

  • 来源:从Skytrax网站(www.airlinequality.com)抓取的所有用户评论。
  • 文件格式:CSV
  • 文件数量:4个
  • 分类
    • 航空公司评论
    • 机场评论
    • 休息室评论
    • 座位评论

数据集详细信息

航空公司评论

  • 总样本数:41396
  • 列信息
    • airline_name: 41396
    • link: 41396
    • title: 41396
    • author: 41396
    • author_country: 39805
    • date: 41396
    • content: 41396
    • aircraft: 1278
    • type_traveller: 2378
    • cabin_flown: 38520
    • route: 2341
    • overall_rating: 36861
    • seat_comfort_rating: 33706
    • cabin_staff_rating: 33708
    • food_beverages_rating: 33264
    • inflight_entertainment_rating: 31114
    • ground_service_rating: 2203
    • wifi_connectivity_rating: 565
    • value_money_rating: 39723
    • recommended: 41396

机场评论

  • 总样本数:17721
  • 列信息
    • airport_name: 17721
    • link: 17721
    • title: 17721
    • author: 17721
    • author_country: 12777
    • date: 17721
    • content: 17721
    • experience_airport: 647
    • date_visit: 593
    • type_traveller: 646
    • overall_rating: 13796
    • queuing_rating: 12813
    • terminal_cleanliness_rating: 12815
    • terminal_seating_rating: 587
    • terminal_signs_rating: 27
    • food_beverages_rating: 630
    • airport_shopping_rating: 12676
    • wifi_connectivity_rating: 412
    • airport_staff_rating: 26
    • recommended: 17721

休息室评论

  • 总样本数:2264
  • 列信息
    • airline_name: 2264
    • link: 2264
    • title: 2264
    • author: 2264
    • author_country: 1783
    • date: 2264
    • content: 2264
    • lounge_name: 2261
    • airport: 2170
    • lounge_type: 1964
    • date_visit: 99
    • type_traveller: 119
    • overall_rating: 2259
    • comfort_rating: 2264
    • cleanliness_rating: 2264
    • bar_beverages_rating: 2259
    • catering_rating: 2261
    • washrooms_rating: 2238
    • wifi_connectivity_rating: 2253
    • staff_service_rating: 2255
    • recommended: 2264

座位评论

  • 总样本数:1258
  • 列信息
    • airline_name: 1258
    • link: 1258
    • title: 1258
    • author: 1258
    • author_country: 1250
    • date: 1258
    • content: 1258
    • aircraft: 1258
    • seat_layout: 1252
    • date_flown: 113
    • cabin_flown: 1252
    • type_traveller: 118
    • overall_rating: 1257
    • seat_legroom_rating: 1258
    • seat_recline_rating: 1258
    • seat_width_rating: 1258
    • aisle_space_rating: 1258
    • viewing_tv_rating: 1229
    • power_supply_rating: 62
    • seat_storage_rating: 113
    • recommended: 1258
搜集汇总
数据集介绍
main_image_url
构建方式
Skytrax用户评论数据集是通过网络爬虫技术从Skytrax网站(www.airlinequality.com)上抓取的用户评论构建而成。该数据集涵盖了航空公司、机场、休息室和座位四个类别的用户评论,共计包含超过六万条评论数据。尽管Skytrax未明确公布这些评论的许可协议,但其网站并未通过robots.txt文件明确禁止爬取操作,因此数据集得以合法构建。数据以CSV格式存储,每个类别对应一个文件,便于后续分析与处理。
特点
该数据集的特点在于其广泛覆盖了航空服务领域的多个维度,包括航空公司、机场、休息室和座位的用户评价。每个类别的评论数据均包含丰富的字段信息,如评论标题、作者、作者国籍、评论日期、内容以及多个维度的评分(如总体评分、座位舒适度评分、餐饮评分等)。此外,数据集还提供了用户的旅行类型、飞行路线、机型等详细信息,为深入分析用户对航空服务的满意度提供了多维度的数据支持。
使用方法
使用该数据集时,研究人员可以通过加载CSV文件,利用数据分析工具(如Python的Pandas库)对数据进行清洗、整理和分析。数据集的结构清晰,每个类别的评论数据均以表格形式呈现,便于进行统计分析和可视化。例如,可以通过计算各航空公司的平均评分来评估其服务质量,或通过分析不同国家的用户评论来探讨文化差异对航空服务评价的影响。此外,数据集还可用于构建机器学习模型,预测用户对航空服务的推荐意愿,从而为航空公司提供改进建议。
背景与挑战
背景概述
Skytrax用户评论数据集于2015年8月2日创建,源自Skytrax网站(www.airlinequality.com)上的用户评论。该数据集由匿名研究人员通过网页抓取技术构建,涵盖了航空公司、机场、休息室和座位四大类别的用户反馈。尽管Skytrax未明确公开这些评论的许可协议,但其内容可通过浏览器公开访问,且网站的robots.txt文件未明确禁止抓取行为。该数据集的核心研究问题在于通过用户评论分析航空服务质量的各个方面,为航空公司和机场提供改进服务的依据。其影响力体现在为航空服务质量评估、用户体验研究以及相关领域的机器学习模型训练提供了丰富的数据支持。
当前挑战
Skytrax用户评论数据集在解决航空服务质量评估问题时面临多重挑战。首先,数据集中存在大量缺失值,例如某些评分字段的缺失率较高,这可能导致分析结果的偏差。其次,评论内容的多样性和主观性增加了自然语言处理的难度,尤其是在情感分析和主题提取方面。此外,数据集的构建过程中,网页抓取技术面临反爬虫机制的阻碍,且评论的匿名性和时间跨度较大,可能导致数据的一致性和时效性问题。这些挑战不仅影响了数据的质量,也对后续的分析和应用提出了更高的技术要求。
常用场景
经典使用场景
Skytrax用户评论数据集广泛应用于航空服务质量分析领域。研究人员通过分析该数据集中的航空公司、机场、座位和休息室评论,能够深入挖掘用户对航空服务的满意度及其影响因素。这些评论涵盖了从座位舒适度到餐饮质量等多个维度,为研究者提供了丰富的文本和评分数据,支持情感分析、服务质量评估以及用户行为研究。
解决学术问题
该数据集有效解决了航空服务领域中的多个学术研究问题。通过分析用户评论,研究者能够识别影响乘客满意度的关键因素,如座位舒适度、餐饮质量和服务态度等。此外,数据集支持情感分析模型的构建,帮助理解用户情感倾向及其对服务评价的影响。这些研究成果为航空公司优化服务策略提供了科学依据,推动了航空服务质量的提升。
衍生相关工作
基于Skytrax用户评论数据集,衍生出多项经典研究工作。例如,研究者利用该数据集构建了情感分析模型,用于预测用户对航空服务的满意度。此外,部分研究通过文本挖掘技术,提取用户评论中的关键主题,揭示了影响乘客体验的核心因素。这些研究不仅推动了自然语言处理技术在航空领域的应用,也为航空服务优化提供了数据驱动的决策支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作