Chicago Taxi Trip dataset
收藏github2022-12-28 更新2024-05-31 收录
下载链接:
https://github.com/jiaawe/taxitrips
下载链接
链接失效反馈官方服务:
资源简介:
该数据集收集于美国伊利诺伊州的芝加哥,数据从2013年至今。数据集追踪了芝加哥的出租车,这些出租车由私人公司运营并由城市授权。大多数出租车行程报告给芝加哥的监管机构,该机构收集这些信息。数据特征包括出租车ID、行程长度、距离、费用、小费等。
This dataset was collected in Chicago, Illinois, USA, with data spanning from 2013 to the present. The dataset tracks taxis in Chicago, which are operated by private companies and authorized by the city. Most taxi trips are reported to the regulatory agency in Chicago, which collects this information. The data features include taxi ID, trip length, distance, fare, and tip.
创建时间:
2022-12-28
原始信息汇总
数据集概述
名称: 芝加哥出租车行程数据集
地点: 美国伊利诺伊州芝加哥
时间范围: 2013年至今
数据来源: 芝加哥的出租车由私人公司运营并由市政府许可。大多数出租车行程信息被报告给芝加哥的监管机构,该机构收集这些信息。
数据特征: 包括出租车ID、行程长度、距离、费用、小费等。
数据分析
-
平均行程统计:
- 平均费用: $15.62
- 平均小费: $1.42
- 平均行程长度: 约3.2英里(或~5公里)
- 平均行程时间: 约12.4分钟
-
公司市场份额:
- Taxi Affiliation Services: 25%
- Flash Cab: 11.8%
- 其他公司: 单数字百分比
-
每日需求趋势:
- 最高需求时间: 下午6-7点
- 最低需求时间: 凌晨5点
- 平均费用高峰: 凌晨5点
-
年度行程趋势:
- 2014年高峰: 3700万次行程
- 2022年: 约600万次行程
-
支付方式趋势:
- 现金使用减少,信用卡使用增加
- 2022年,信用卡成为主要支付方式
-
费用与小费关系:
- 正相关,高费用通常伴随高小费
进一步分析建议
- 深入研究趋势和洞察: 如费用、小费、支付方式等。
- 相关性与因果关系: 考虑混杂变量,如司机供应与需求的关系。
- 针对不同视角的分析: 消费者、竞争者、研究者等的需求。
搜集汇总
数据集介绍

构建方式
芝加哥出租车行程数据集(Chicago Taxi Trip dataset)的构建基于芝加哥市监管机构对私营出租车公司运营数据的收集。自2013年起,该机构持续记录并汇总了包括出租车ID、行程长度、距离、费用和小费等在内的多维度信息。为确保数据的代表性和准确性,数据集经过清洗,剔除了费用为0或超过100美元以及行程低于50英里的异常记录。
使用方法
用户可通过Kaggle平台访问该数据集,并利用其进行多种分析。例如,通过分析行程时间和费用,可以评估交通拥堵状况;通过研究不同时间段的行程分布,可以优化出租车调度策略;通过考察支付方式的变化,可以洞察消费者支付习惯的演变。此外,数据集还可用于研究出租车行业的市场趋势,如需求变化、价格波动等,为政策制定和商业决策提供数据支持。
背景与挑战
背景概述
芝加哥出租车行程数据集(Chicago Taxi Trip dataset)自2013年起由芝加哥市政府监管机构收集,涵盖了该市由私营公司运营并获得许可的出租车行程数据。该数据集记录了包括出租车ID、行程长度、距离、费用和小费等在内的多项特征,旨在为城市交通管理、出租车行业分析以及消费者行为研究提供数据支持。该数据集不仅为学术界和产业界提供了丰富的研究素材,还在城市交通规划、出租车服务优化等领域产生了深远影响。
当前挑战
该数据集在解决出租车行业相关问题的过程中面临多重挑战。首先,数据集中存在大量异常值,如费用为0或超过100美元的行程,以及行程距离超过50英里的记录,这些异常值需要通过数据清洗来提高数据的代表性和准确性。其次,数据集中部分公司的信息缺失,可能属于小型或未注册公司,这为市场占有率分析带来了困难。此外,随着网约车服务的兴起,传统出租车行业的市场份额逐渐萎缩,如何从数据中提取出有效的趋势和洞察,以应对行业变革,成为一大挑战。最后,数据集中支付方式的变化趋势反映了消费者偏好的转变,如何平衡现金与信用卡支付的支持,也是出租车公司需要面对的实际问题。
常用场景
经典使用场景
在交通规划与城市管理领域,Chicago Taxi Trip数据集被广泛应用于分析出租车服务的需求模式、交通流量分布以及乘客支付行为。通过该数据集,研究者能够深入探讨城市交通的动态变化,优化出租车调度策略,提升城市交通效率。
解决学术问题
该数据集为解决城市交通研究中的关键问题提供了数据支持,如出租车服务的供需平衡、交通拥堵的时空分布、以及乘客支付偏好的演变。通过对这些问题的深入研究,学者们能够提出更具针对性的政策建议,推动城市交通系统的可持续发展。
实际应用
在实际应用中,Chicago Taxi Trip数据集被用于开发智能交通系统,优化出租车调度算法,以及预测交通高峰期的需求变化。此外,该数据集还为出租车公司提供了市场分析工具,帮助其制定更具竞争力的定价策略和服务模式。
数据集最近研究
最新研究方向
近年来,芝加哥出租车行程数据集(Chicago Taxi Trip dataset)在交通管理和城市经济学领域引起了广泛关注。该数据集记录了自2013年至今的出租车行程信息,涵盖了行程距离、费用、小费等关键特征。当前的研究方向主要集中在利用这些数据优化城市交通系统、分析乘客行为模式以及评估共享经济对传统出租车行业的影响。特别是在新冠疫情后,研究如何通过数据驱动的策略恢复和提升出租车服务的需求成为热点。此外,该数据集还被用于探索支付方式的演变趋势,以及如何通过动态定价策略提高出租车运营效率。这些研究不仅为政策制定者提供了科学依据,也为出租车公司优化资源配置和提升服务质量提供了重要参考。
以上内容由遇见数据集搜集并总结生成



