Qatar Cars
收藏github2025-07-09 更新2025-07-18 收录
下载链接:
https://github.com/profmusgrave/qatarcars
下载链接
链接失效反馈官方服务:
资源简介:
该数据集收集了卡塔尔汽车的相关信息,包括品牌、型号、尺寸、座位数、燃油经济性、马力、价格等15个变量,共89条记录。数据来源于在线汽车网站和学生收集。
This dataset contains relevant information about vehicles in Qatar, including 15 variables such as brand, model, dimensions, seating capacity, fuel economy, horsepower, and price, with a total of 89 records. The data was sourced from online automotive websites and collected by students.
创建时间:
2025-07-08
原始信息汇总
数据集概述:Qatar Cars
基本信息
- 标题: Qatar Cars
- 作者: Paul Musgrave
- ORCID: https://orcid.org/0000-0002-8984-4992
- 机构: Georgetown University Qatar
- 地址: Education City, Doha, Qatar
- 邮箱: rpm47@georgetown.edu
- 数据收集日期: 2025年1月
- 地理收集位置: 卡塔尔多哈
- 资金来源: 无
共享与访问信息
- 许可证: Mozilla Public License Version 2.0
- 数据来源: YallaMotor Qatar的车辆销售列表及其他互联网来源
- 推荐引用:
Musgrave, Paul. 2025. "Introducing the Qatar Cars Dataset." July 8. https://musgrave.substack.com/p/introducing-the-qatar-cars-dataset
数据文件概述
- 文件列表:
- readme
- qatarcars.dta
- qatarcars.csv
- 文件关系: 数据相同,格式不同
- 附加数据: 无
- 多版本数据集: 无
方法学信息
- 数据收集方法:
数据收集自在线汽车网站,通过Google Forms和电子表格完成。作为乔治城大学国际政治专业统计课程的一部分,学生被分配汽车制造商并收集每个制造商的一到三个品牌数据。Musgrave编辑并确保数据格式一致。
数据特定信息
- 变量数量: 15
- 行数: 89
- 变量列表:
- origin: 汽车原产国(德国、意大利、日本、中国、韩国、瑞典、英国、美国)
- make: 汽车品牌(28个唯一变量,如奥迪、宝马等)
- model: 车型(89个唯一型号,如Tiggo 8 Pro Max和Rav4 Hybrid)
- length: 长度(米)
- width: 宽度(米)
- height: 高度(米)
- seating: 座位数
- trunk: 后备箱容量(升)
- economy: 燃油经济性(升/100公里)
- horsepower: 马力(马力)
- price: 价格(卡塔尔里亚尔)
- mass: 质量(千克)
- performance: 0-100公里/小时加速时间(秒)
- type: 类型(轿跑、掀背车、SUV、轿车)
- enginetype: 发动机类型(电动、混合动力、汽油)
- 缺失数据代码: 电动车辆的经济性数据标记为“.”(不适用)
搜集汇总
数据集介绍

构建方式
在汽车工业蓬勃发展的背景下,Qatar Cars数据集通过系统化采集多源汽车数据构建而成。该数据集由乔治城大学卡塔尔分校的国际政治专业学生在统计课程中完成,数据来源主要包括YallaMotor卡塔尔汽车销售平台及其他网络资源。研究人员采用Google Forms和电子表格进行数据收集,每位学生负责1-3个汽车品牌的数据采集工作,最后由项目负责人对数据进行统一校审,确保格式规范与数据一致性。
特点
作为中东地区汽车市场的微观样本,该数据集涵盖15个关键变量和89个汽车型号记录,具有显著的地域特色。数据维度包括车辆物理参数(长宽高、质量)、性能指标(马力、加速性能)、经济性(燃油效率)及市场信息(价格、类型)等,特别区分了传统燃油车与电动车的动力类型。值得注意的是,数据集完整保留了原始数据特征,如电动车燃油经济性字段的缺失值处理,体现了数据采集过程的严谨性。
使用方法
该数据集以Stata(.dta)和CSV(.csv)双格式提供,支持主流统计分析软件的直接调用。研究者可基于车辆原产国、动力类型等分类变量进行市场对比分析,或利用连续变量探究汽车物理参数与性能价格的相关性。特别适用于汽车产业研究、区域消费特征分析及环保政策评估等领域,但需注意电动车燃油经济性数据的特殊缺失值处理方式。使用时应遵循Mozilla Public License 2.0协议要求,并按规定格式引用数据集。
背景与挑战
背景概述
Qatar Cars数据集由乔治城大学卡塔尔分校的Paul Musgrave教授于2025年主导创建,旨在为国际政治专业的统计学课程提供实践性教学资源。该数据集聚焦于多哈地区的汽车市场特征,收录了来自28个品牌的89款车型的15项关键参数,包括尺寸规格、动力性能、价格区间等结构化数据。数据来源整合了YallaMotor卡塔尔销售平台及多种网络渠道,系统性地呈现了中东地区汽车消费市场的技术参数分布格局,为区域经济研究和汽车产业分析提供了量化基础。
当前挑战
该数据集面临的核心挑战体现在两个维度:在领域问题层面,如何准确表征电动汽车与传统燃油车在技术指标体系的差异性成为关键难题,例如电动车型的燃油经济性指标存在天然缺失;在构建过程中,跨平台数据源的异构格式整合消耗了大量清洗成本,学生团队采集的原始数据需要经过严格的标准化处理才能确保变量单位的一致性。此外,样本量受限于教学项目规模,对细分车型市场的覆盖度仍有提升空间。
常用场景
经典使用场景
在汽车工业与市场研究领域,Qatar Cars数据集为分析中东地区特别是卡塔尔汽车市场的消费偏好提供了宝贵资源。其经典使用场景包括对不同品牌、型号车辆的性能、价格及燃油经济性进行横向比较,尤其适合研究高端汽车品牌在富裕国家的市场表现。数据集中的多维度变量如发动机类型、车身尺寸和加速性能,为研究者构建复杂的市场分析模型奠定了数据基础。
衍生相关工作
基于该数据集已产生多项区域经济研究,包括《海湾国家汽车消费的能源转型特征》等论文。其数据采集方法论被改编为中东商业分析课程的案例教材,衍生开发的R语言清洗模板极大提升了非结构化汽车数据的处理效率。部分学者正将其与迪拜汽车销售数据构建波斯湾地区对比研究框架。
数据集最近研究
最新研究方向
随着全球汽车产业向电动化与智能化转型,Qatar Cars数据集为研究海湾地区汽车市场特征提供了独特视角。该数据集近期被广泛应用于分析豪华汽车品牌在中东市场的渗透率,特别是德系与日系品牌在卡塔尔消费者偏好中的差异化表现。研究者正探索车身尺寸参数与当地气候条件的关联性,以及混合动力车型在高温环境下的性能数据标准化问题。数据集中的电动车型缺失值处理方案,为同类交通研究提供了方法论参考。2025年迪拜气候大会前夕,该数据支持的碳排放研究成为区域可持续发展讨论的重要依据。
以上内容由遇见数据集搜集并总结生成



