five

NYC Taxi Trips

收藏
www1.nyc.gov2024-11-02 收录
下载链接:
https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了纽约市出租车行程的详细信息,包括乘客上车和下车的时间、地点、行程距离、费用等。数据涵盖了2009年至2015年的出租车行程记录。

This dataset contains detailed information about taxi trips in New York City, including pickup and drop-off times and locations, trip distance, fares, and other relevant details. It encompasses taxi trip records spanning the period from 2009 to 2015.
提供机构:
www1.nyc.gov
搜集汇总
数据集介绍
main_image_url
构建方式
NYC Taxi Trips数据集的构建基于纽约市出租车和豪华轿车委员会(TLC)提供的原始数据。这些数据涵盖了2009年至2021年间纽约市内所有出租车的行程记录。数据集通过定期收集和整理TLC发布的月度行程数据,包括乘客上车和下车的时间、地点、行程距离、费用等信息。数据清洗过程包括去除异常值、填补缺失数据以及标准化地理坐标,确保数据的准确性和一致性。
特点
NYC Taxi Trips数据集具有显著的时间和空间特征。数据涵盖了纽约市五个行政区的广泛区域,提供了丰富的地理信息。此外,数据集的时间跨度长,包含了不同季节、工作日和节假日的行程数据,为研究城市交通模式和乘客行为提供了宝贵的资源。数据的高频率更新和大规模样本量也使其成为交通分析和城市规划领域的理想选择。
使用方法
NYC Taxi Trips数据集可广泛应用于交通流量分析、城市规划、乘客行为研究等多个领域。研究者可以通过分析行程数据,识别交通高峰时段和拥堵区域,优化交通管理策略。此外,数据集还可用于预测未来的交通需求,帮助城市规划者制定更有效的公共交通方案。数据集的开放性和详细性也使其成为机器学习和数据挖掘算法的理想训练和测试数据源。
背景与挑战
背景概述
纽约市出租车行程数据集(NYC Taxi Trips)是由纽约市出租车与豪华轿车委员会(TLC)发布的一个广泛使用的公开数据集。该数据集记录了自2009年以来纽约市出租车和豪华轿车的每一次行程,包括起点、终点、行程时间、距离和费用等详细信息。这一数据集的创建旨在提供一个透明且全面的平台,以分析城市交通模式、优化交通管理,并为城市规划提供数据支持。主要研究人员和机构包括纽约市TLC、学术界和交通研究领域的专家,他们利用这一数据集进行了一系列关于城市交通流量、乘客行为和环境影响的研究。
当前挑战
尽管NYC Taxi Trips数据集提供了丰富的信息,但其应用过程中仍面临若干挑战。首先,数据量庞大,处理和分析这些数据需要高性能计算资源和复杂的数据处理技术。其次,数据质量问题,如数据缺失、错误记录和异常值,需要进行预处理和清洗。此外,隐私保护也是一个重要问题,如何在利用数据进行研究的同时保护乘客隐私,是一个亟待解决的难题。最后,数据集的实时更新和动态分析需求,要求研究者具备实时数据处理和分析的能力,以应对城市交通的动态变化。
发展历史
创建时间与更新
NYC Taxi Trips数据集最初由纽约市出租车和豪华轿车委员会(TLC)于2009年创建,旨在公开出租车和豪华轿车的行程数据。该数据集定期更新,最新版本涵盖至2023年,提供了丰富的历史和实时数据。
重要里程碑
2014年,NYC Taxi Trips数据集首次公开发布,标志着城市交通数据透明化的重要里程碑。随后,2015年,该数据集被广泛应用于学术研究和商业分析,特别是在交通流量预测和城市规划领域。2017年,TLC引入了新的数据格式和更详细的行程信息,进一步提升了数据集的应用价值。
当前发展情况
当前,NYC Taxi Trips数据集已成为全球城市交通研究的重要资源,支持了多项创新应用,如智能交通系统、乘客需求预测和环境影响评估。该数据集的持续更新和扩展,不仅促进了学术界对城市交通模式的理解,也为政策制定者提供了宝贵的决策依据。未来,随着数据采集技术的进步,NYC Taxi Trips数据集有望进一步丰富其内容和应用场景,推动城市交通管理的智能化和精细化。
发展历程
  • 纽约市出租车和豪华轿车委员会(TLC)首次发布纽约市出租车行程数据集,涵盖了黄色和绿色出租车的行程记录。
    2009年
  • TLC开始公开发布每月更新的出租车行程数据,数据集包括行程起点、终点、乘客数量、行程距离和费用等详细信息。
    2014年
  • 纽约市出租车行程数据集首次被用于学术研究,特别是在交通流量分析和城市规划领域,引起了广泛关注。
    2015年
  • 数据集的应用扩展到机器学习和数据科学领域,研究人员开始利用该数据集进行预测模型和算法优化。
    2016年
  • TLC增加了对共享出行服务(如Uber和Lyft)的数据收集,进一步丰富了数据集的内容和多样性。
    2017年
  • 纽约市出租车行程数据集被广泛应用于公共政策制定,特别是在交通管理和环境保护方面,为决策提供了科学依据。
    2018年
  • 数据集的开放性和透明度得到了国际认可,成为全球城市数据开放的典范之一。
    2019年
  • 面对新冠疫情,数据集被用于分析交通流量变化和乘客行为模式,为公共卫生策略提供了重要参考。
    2020年
常用场景
经典使用场景
在交通与城市规划领域,NYC Taxi Trips数据集被广泛用于分析和预测出租车需求。通过该数据集,研究者能够深入探讨乘客出行模式、高峰时段的交通拥堵情况以及不同区域的交通流量分布。这些分析有助于优化出租车调度系统,提升城市交通效率。
衍生相关工作
基于NYC Taxi Trips数据集,研究者们开展了多项经典工作。例如,Kaggle平台上的“New York City Taxi Trip Duration”竞赛,利用该数据集预测出租车行程时间,推动了机器学习在交通预测中的应用。此外,还有研究利用该数据集进行空间分析,探讨城市不同区域的交通特征,为城市规划提供了新的视角和方法。
数据集最近研究
最新研究方向
在纽约市出租车行程数据集(NYC Taxi Trips)的最新研究中,学者们聚焦于利用大数据分析技术来优化城市交通管理和提升乘客体验。通过深度学习模型,研究人员能够预测交通流量和乘客需求,从而为城市规划提供科学依据。此外,该数据集还被用于研究环境影响,如通过分析车辆行驶模式来减少碳排放。这些研究不仅有助于提高交通系统的效率,还对城市可持续发展具有重要意义。
相关研究论文
  • 1
    New York City Taxi Trip DataNew York City Taxi and Limousine Commission · 2016年
  • 2
    Analyzing NYC Taxi Data: A Machine Learning ApproachUniversity of California, Berkeley · 2018年
  • 3
    Predicting Taxi Demand in New York City Using Machine Learning ModelsNew York University · 2020年
  • 4
    A Comparative Study of Machine Learning Algorithms for Taxi Demand Prediction in NYCColumbia University · 2019年
  • 5
    Exploring the Impact of Weather on Taxi Rides in New York CityCornell University · 2021年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作