Ford GoBike System Data
收藏github2021-11-26 更新2024-05-31 收录
下载链接:
https://github.com/DeleLinus/Ford-GoBike-System-Data-Exploration
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含2019年旧金山湾区自行车共享系统中的183,412次骑行信息,包括骑行时长、起止时间、起止站点信息、自行车ID、用户类型、用户出生年份、用户性别等16个特征。
This dataset comprises 183,412 cycling records from the San Francisco Bay Area bike-sharing system in 2019. It includes 16 features such as duration of the ride, start and end times, start and end station information, bike ID, user type, user birth year, and user gender.
创建时间:
2021-11-26
原始信息汇总
数据集概述
数据集基本信息
- 名称: Ford GoBike System Data Exploration
- 数据量: 包含183,412次骑行记录
- 覆盖区域: 旧金山湾区
- 时间范围: 2019年
- 原始特征数: 16个
- 处理后特征数: 11个
数据集特征
- 原始特征: duration_sec, start_time, end_time, start_station_id, start_station_name, start_station_latitude, start_station_longitude, end_station_id, end_station_name, end_station_latitude, end_station_longitude, bike_id, user_type, member_birth_year, member_gender, bike_share_for_all_trip
- 处理后新增特征:
- day_of_week: 从start_time提取的周几信息
- start_hour: 从start_time提取的小时信息
- time_of_day: 从start_hour提取的一天中的时间段
- duration_min: 骑行时长(分钟)
- user_age: 用户年龄
- user_age_bin: 年龄分组
数据集发现
- 用户类型与骑行习惯:
- 订阅者和非订阅者的骑行高峰日不同,订阅者主要在工作日骑行,非订阅者周末骑行量增加。
- 订阅者平均骑行时长为10-11分钟,非订阅者为23-24分钟。
- 非订阅者骑行时长超过一小时的概率高于订阅者。
- 非订阅者多在下午开始骑行,订阅者则多在早晨和下午。
- 平均骑行时长:
- 周末(周六和周日)的平均骑行时长比其他日子长。
演示重点
- 分析一天中的时间和一周中的哪一天骑行量最大。
- 探讨平均骑行时长及其是否受用户类型(订阅者或非订阅者)影响。
- 结果显示,用户的类型确实影响平均骑行时长,非订阅者的骑行时长在每周的每一天和一天中的每个时间段都比订阅者长。
搜集汇总
数据集介绍

构建方式
Ford GoBike System Data数据集基于2019年旧金山湾区共享单车系统的骑行记录构建而成。原始数据包含183,412条骑行记录,涵盖16个特征,如骑行时长、起始时间、起始站点信息、用户类型等。在数据清洗过程中,通过特征工程生成了新的列,如骑行时长(分钟)、用户年龄、骑行时间段等,最终数据集被精简为11列,以便于进一步的分析和探索。
特点
该数据集的特点在于其详细记录了每次骑行的时空信息及用户属性。通过起始时间和结束时间,可以分析骑行的时段分布;通过起始站点和结束站点的经纬度,可以研究骑行的空间分布。此外,数据集还包含了用户类型(订阅用户与非订阅用户)、用户年龄和性别等信息,为研究不同用户群体的骑行行为提供了丰富的数据支持。特别值得注意的是,数据集经过特征工程后,新增了骑行时长(分钟)、用户年龄分组等字段,进一步增强了数据的分析潜力。
使用方法
Ford GoBike System Data数据集可用于分析共享单车系统的使用模式及用户行为。研究者可以通过时间维度(如工作日与周末、早晨与下午)和空间维度(如起始站点与结束站点)探索骑行的时空分布规律。此外,结合用户类型、年龄和性别等属性,可以深入分析不同用户群体的骑行偏好与行为差异。数据集还可用于构建预测模型,如预测骑行时长或用户类型,为共享单车系统的运营优化提供数据支持。
背景与挑战
背景概述
Ford GoBike System Data数据集由福特公司于2019年发布,涵盖了旧金山湾区共享单车系统的骑行数据。该数据集由Ayanwoye Gideon Ayandele等研究人员进行探索和分析,旨在揭示共享单车使用模式及其与用户类型之间的关系。数据集包含183,412条骑行记录,涵盖了16个特征,如骑行时长、起始时间、起始站点、用户类型、用户年龄等。通过对数据的清洗和特征工程,研究人员进一步提取了诸如骑行时长、用户年龄分组等新特征,为共享单车系统的优化和用户行为研究提供了重要参考。该数据集在交通规划、城市可持续发展和用户行为分析等领域具有广泛的应用价值。
当前挑战
Ford GoBike System Data数据集在解决共享单车使用模式分析问题时面临多重挑战。首先,原始数据中存在大量噪声和缺失值,例如用户年龄和性别信息不完整,这增加了数据清洗和预处理的复杂性。其次,用户类型(订阅用户与非订阅用户)的骑行行为差异显著,如何准确捕捉并解释这些差异是数据分析的核心挑战之一。此外,数据的时间维度(如工作日与周末的骑行模式)和空间维度(如起始站点的分布)的复杂性,要求研究人员在特征工程和模型构建中具备较高的技术能力。最后,数据集的规模较大,如何在保证分析精度的同时提高计算效率,也是实际应用中的一大挑战。
常用场景
经典使用场景
Ford GoBike System Data数据集广泛应用于城市交通规划和共享单车系统优化研究。通过对2019年旧金山湾区183,412次骑行数据的分析,研究者能够深入探讨骑行行为的时空分布特征,揭示用户类型(订阅用户与普通用户)在骑行习惯上的显著差异。这一数据集为理解城市居民的出行模式提供了宝贵的数据支持。
实际应用
在实际应用中,Ford GoBike System Data数据集被用于优化共享单车系统的运营策略。例如,通过分析用户骑行的高峰时段和热门站点,运营商可以合理调度车辆,减少供需不平衡问题。此外,该数据集还为城市交通管理部门提供了数据支持,帮助制定更高效的公共交通政策。
衍生相关工作
基于Ford GoBike System Data数据集,许多经典研究工作得以展开。例如,研究者利用该数据集开发了预测骑行需求的机器学习模型,为共享单车系统的动态调度提供了技术支持。此外,还有研究通过分析用户骑行行为,提出了针对不同用户群体的个性化服务策略,进一步提升了共享单车系统的运营效率。
以上内容由遇见数据集搜集并总结生成



