Divvy Bike Sharing Data
收藏github2023-12-18 更新2024-05-31 收录
下载链接:
https://github.com/kapibarr/big-data-project
下载链接
链接失效反馈官方服务:
资源简介:
本数据集包含了Divvy在芝加哥的自行车共享系统的使用数据,用于分析自行车租赁业务的增长、收入、支出、季节性变化等。
This dataset encompasses usage data from Divvy's bike-sharing system in Chicago, designed for analyzing the growth, revenue, expenditures, and seasonal variations of the bike rental business.
创建时间:
2023-04-06
原始信息汇总
数据集概述
项目主题
- 分析芝加哥Divvy共享单车数据:该项目专注于分析芝加哥Divvy共享单车系统的开放数据集。
项目目标
- 业务动态分析:评估用户数量、骑行次数和收益的增长情况。
- 收入计算:根据网站描述的费率及估计的订阅者数量计算收入。
- 成本计算:考虑多个指标(如租赁区域成本、自行车移动成本等)计算成本。
- 季节性分析:研究骑行需求随星期、月份和时间的变化,以及其季节性变化。
- 自行车负载分析:计算为满足95%需求所需的可用自行车数量。
- 最受欢迎站点间距离计算:测量最受欢迎的站点对之间的直接距离。
- 自行车使用分析:分析每辆自行车在租赁中的使用情况和行驶距离。
- 站点地图标注:在芝加哥地图上标注站点位置。
- 站点摆动分析:识别具有摆动迁移模式的站点。
数据集描述
- 数据集来源:数据集来自Divvy共享单车系统的官方网站和GitHub仓库。
- 数据集文件:
2013-2023_3_months.ipynb:比较2023年前三个月与其他年份的数据。amount_of_rides_per_year.ipynb:计算每年骑行次数。basic_statistic.ipynb:进行基本统计分析,包括用户类型、骑行时间、自行车类型等。bicycle_losses.ipynb:计算丢失的自行车数量。circularity_stations_analysis.ipynb:分析具有摆动迁移模式的站点。costs_count.ipynb:评估项目成本。distance_between_stations.ipynb:计算站点间的直接距离。distance_per_bike.ipynb:分析每辆自行车每年的行驶距离和使用寿命。full_price_calculation.ipynb:计算总收入。gender-age.ipynb:分析用户性别和年龄分布。getting_big_tables.ipynb:从下载的数据中获取完整的数据集。load_model.ipynb:分析自行车负载,确定最繁忙的站点。map_station.ipynb:在地图上分布站点。members_procent_circularity.ipynb:估算基于摆动迁移站点的订阅者数量上限。minute_2022.ipynb:评估2022年每分钟骑行的成本。moving_bikes_model.ipynb:计算向过载站点移动自行车的最佳策略。park_station.ipynb:估算基于公园站点的订阅者数量下限。season_analysis.ipynb:分析骑行的季节性变化。station_graphs.ipynb:在图表中检查站点ID类型相似性对连接的影响。stations_statistic.ipynb:统计站点的绝对和平均容量及数量。
搜集汇总
数据集介绍

构建方式
Divvy Bike Sharing Data数据集是通过芝加哥市的自行车共享系统Divvy收集的。该系统通过遍布城市的自行车站点,记录每次自行车的租借和归还信息。数据采集过程自动化,涵盖了用户ID、租借时间、归还时间、起始站点和终点站等关键信息。这些数据经过清洗和整理,以确保其准确性和一致性,最终形成可供研究使用的结构化数据集。
特点
该数据集的特点在于其全面性和实时性。它不仅记录了自行车租借的基本信息,还包含了用户的匿名化数据,如性别、出生年份等,为研究城市交通模式、用户行为分析提供了丰富的数据支持。此外,数据集的更新频率高,能够反映最新的城市交通动态,为城市规划和管理提供实时参考。
使用方法
使用Divvy Bike Sharing Data数据集时,研究人员可以通过分析租借模式来优化自行车站点的布局和数量。此外,结合地理信息系统(GIS)技术,可以进一步研究城市交通流量和热点区域。数据集还可用于机器学习模型的训练,预测未来的租借需求,从而提升自行车共享系统的运营效率。
背景与挑战
背景概述
Divvy Bike Sharing Data数据集是由芝加哥交通部门推出的共享单车项目Divvy所收集的公开数据集,首次发布于2013年。该数据集记录了芝加哥市内共享单车的使用情况,包括骑行起点、终点、时间、用户类型等详细信息。其主要研究问题聚焦于城市交通模式的优化、共享单车系统的运营效率提升以及用户行为分析。该数据集为城市交通规划、智能交通系统设计以及共享经济模式的研究提供了宝贵的数据支持,推动了相关领域的学术进展和实践应用。
当前挑战
Divvy Bike Sharing Data数据集在解决城市交通模式分析与共享单车系统优化问题时,面临多重挑战。首先,数据的高维度与复杂性使得用户行为模式的分析和预测变得困难,尤其是在处理大规模时空数据时。其次,数据的不平衡性(如某些区域的骑行记录较少)可能导致模型训练的偏差。此外,数据采集过程中可能存在的噪声和缺失值也对数据质量提出了挑战。构建过程中,如何确保数据的实时性、完整性和隐私保护也是研究人员需要克服的重要问题。
常用场景
经典使用场景
Divvy Bike Sharing Data数据集广泛应用于城市交通规划和共享单车系统的优化研究中。通过对大量骑行数据的分析,研究人员能够深入理解用户的骑行模式、高峰时段以及热门路线,从而为城市交通管理提供科学依据。
实际应用
在实际应用中,Divvy Bike Sharing Data被用于城市交通管理部门制定政策、优化共享单车布局以及提升公共交通系统的整体效率。此外,企业也利用这些数据改进单车投放策略,提升运营效率。
衍生相关工作
基于Divvy Bike Sharing Data,许多经典研究工作得以展开,例如基于机器学习的骑行需求预测模型、共享单车调度优化算法以及城市交通流量分析工具。这些研究不仅推动了学术进展,也为实际应用提供了有力支持。
以上内容由遇见数据集搜集并总结生成



