five

Skytrax User Reviews Dataset

收藏
github2018-11-28 更新2024-05-31 收录
下载链接:
https://github.com/erood/skytrax-reviews-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
一个从Skytrax网站上抓取的用户评论数据集,包含航空公司的评论、机场评论、座位评论和休息室评论,共计四个CSV文件。数据集提供了详细的评论内容、评分和用户信息。

A dataset of user reviews scraped from the Skytrax website, including reviews of airlines, airports, seats, and lounges, comprising a total of four CSV files. The dataset provides detailed review content, ratings, and user information.
创建时间:
2015-09-05
原始信息汇总

数据集概述

数据集名称

  • Skytrax 用户评论数据集(2015年8月2日)

数据集来源

  • 数据集是从Skytrax网站(www.airlinequality.com)上抓取的所有用户评论。

数据集内容

  • 数据集包含四种类型的评论,分为四个CSV文件:
    • 航空公司评论:41,396条
    • 机场评论:17,721条
    • 休息室评论:2,264条
    • 座位评论:1,258条

数据集格式

  • 每个CSV文件包含特定类别的评论数据。

航空公司评论数据集

  • 总样本数:41,396
  • 列及其数据量
    • 航空公司名称:41,396
    • 链接:41,396
    • 标题:41,396
    • 作者:41,396
    • 作者国家:39,805
    • 日期:41,396
    • 内容:41,396
    • 飞机类型:1,278
    • 旅行者类型:2,378
    • 客舱类型:38,520
    • 路线:2,341
    • 总体评分:36,861
    • 座位舒适度评分:33,706
    • 客舱服务评分:33,708
    • 餐饮评分:33,264
    • 机上娱乐评分:31,114
    • 地面服务评分:2,203
    • Wi-Fi连接评分:565
    • 性价比评分:39,723
    • 推荐指数:41,396

机场评论数据集

  • 总样本数:17,721
  • 列及其数据量
    • 机场名称:17,721
    • 链接:17,721
    • 标题:17,721
    • 作者:17,721
    • 作者国家:12,777
    • 日期:17,721
    • 内容:17,721
    • 机场体验:647
    • 访问日期:593
    • 旅行者类型:646
    • 总体评分:13,796
    • 排队评分:12,813
    • 终端清洁度评分:12,815
    • 终端座位评分:587
    • 终端指示牌评分:27
    • 餐饮评分:630
    • 机场购物评分:12,676
    • Wi-Fi连接评分:412
    • 机场员工评分:26
    • 推荐指数:17,721

休息室评论数据集

  • 总样本数:2,264
  • 列及其数据量
    • 航空公司名称:2,264
    • 链接:2,264
    • 标题:2,264
    • 作者:2,264
    • 作者国家:1,783
    • 日期:2,264
    • 内容:2,264
    • 休息室名称:2,261
    • 机场:2,170
    • 休息室类型:1,964
    • 访问日期:99
    • 旅行者类型:119
    • 总体评分:2,259
    • 舒适度评分:2,264
    • 清洁度评分:2,264
    • 酒吧饮料评分:2,259
    • 餐饮评分:2,261
    • 洗手间评分:2,238
    • Wi-Fi连接评分:2,253
    • 员工服务评分:2,255
    • 推荐指数:2,264

座位评论数据集

  • 总样本数:1,258
  • 列及其数据量
    • 航空公司名称:1,258
    • 链接:1,258
    • 标题:1,258
    • 作者:1,258
    • 作者国家:1,250
    • 日期:1,258
    • 内容:1,258
    • 飞机类型:1,258
    • 座位布局:1,252
    • 飞行日期:113
    • 客舱类型:1,252
    • 旅行者类型:118
    • 总体评分:1,257
    • 座位腿部空间评分:1,258
    • 座位倾斜度评分:1,258
    • 座位宽度评分:1,258
    • 过道空间评分:1,258
    • 电视观看评分:1,229
    • 电源供应评分:62
    • 座位存储评分:113
    • 推荐指数:1,258
搜集汇总
数据集介绍
main_image_url
构建方式
Skytrax User Reviews Dataset是一个从Skytrax网站(www.airlinequality.com)抓取的用户评论数据集。该数据集的构建基于网站上的所有用户评论,尽管Skytrax发布这些评论的许可证未知,但这些评论对所有拥有浏览器的用户开放,且网站的robots.txt文件并未明确禁止抓取。
特点
该数据集涵盖了航空、机场、贵宾室和座位四个方面的用户评论,分别存储在四个CSV文件中。数据集包含41396条航空评论、17721条机场评论、1258条座位评论以及2264条贵宾室评论。每条评论都包含作者、发布日期、评论内容以及各项评分等信息,为研究航空服务质量提供了一个全面且多维度的视角。
使用方法
用户可以通过直接访问数据集中的CSV文件来使用该数据集。每个CSV文件都包含了结构化的数据字段,便于进行数据分析。此外,数据集还提供了评论的链接,方便用户直接查看原始评论内容。需要注意的是,在使用数据集时,应遵守相关的数据使用规定和道德准则。
背景与挑战
背景概述
Skytrax User Reviews Dataset是一个自Skytrax网站(www.airlinequality.com)抓取的用户评论数据集,创建于2015年8月2日。该数据集涵盖了航空公司、机场、贵宾休息室和座位等方面的用户评论,共计包含超过八万条记录。尽管Skytrax发布这些评论的具体许可协议未知,但这些评论对任何拥有浏览器的用户而言都是可访问的,且网站的robots.txt文件并未明确禁止抓取。该数据集的创建,为研究航空服务质量提供了一个丰富的资源,研究人员和机构可借此深入分析航空服务用户反馈,进而提升服务质量。此数据集的相关研究文章已在网络上发表,展示了其在航空服务研究领域的应用价值。
当前挑战
该数据集在研究领域中面临的挑战主要包括数据的多样性和质量。首先,由于数据来源于用户生成的内容,其质量和准确性可能参差不齐,给数据分析带来了噪声。其次,数据集涵盖了多个类别,如航空公司、机场、贵宾休息室和座位,这就要求研究者在分析时能够有效地区分和处理不同类型的数据。此外,由于缺乏明确的许可协议,数据集的使用可能存在法律风险。构建过程中的挑战则体现在如何确保数据抓取的合法性、如何处理大量的非结构化文本数据,以及如何从这些数据中提取有用信息,以服务于具体的研究问题。
常用场景
经典使用场景
在航空服务品质研究领域,Skytrax User Reviews Dataset数据集的运用尤为广泛。该数据集涵盖了航空、机场、座位及休息室的用户评价,成为分析航空服务质量、旅客满意度及服务改进的关键资源。其经典使用场景在于,研究者通过对评价内容的深度挖掘,可揭示旅客对不同航空公司、机场设施及服务的偏好与期望。
实际应用
在实际应用中,Skytrax User Reviews Dataset数据集被航空公司和机场管理部门用于监控服务质量,作为客户满意度调查的辅助工具。它帮助决策者了解旅客的真实反馈,进而优化服务流程、提升旅客体验,甚至影响航空公司的商业决策和市场定位。
衍生相关工作
基于该数据集,学术界产生了诸多相关研究工作,如旅客满意度模型构建、服务质量影响因素分析等。这些研究不仅丰富了航空服务管理的理论体系,也为航空业提供了实用的管理策略和决策支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作