Bike Sharing Dataset
收藏github2024-03-02 更新2024-05-31 收录
下载链接:
https://github.com/kurniagilang/dataset
下载链接
链接失效反馈官方服务:
资源简介:
自行车共享数据集,记录了2011年和2012年Capital Bikeshare系统的历史日志,数据包括环境、季节性设置对自行车租赁行为的影响。数据集可用于回归分析、事件和异常检测等任务。
The bike-sharing dataset documents the historical logs of the Capital Bikeshare system for the years 2011 and 2012, encompassing data on how environmental and seasonal settings influence bike rental behaviors. This dataset is suitable for tasks such as regression analysis, event detection, and anomaly detection.
创建时间:
2024-03-02
原始信息汇总
数据集概述
数据集名称
Bike Sharing Dataset
数据集背景
- 自行车共享系统是传统自行车租赁的新一代,整个流程自动化,用户可以轻松租借和归还自行车。
- 全球有超过500个自行车共享项目,超过500万辆自行车。
- 自行车共享系统因其在交通、环境和健康问题中的重要作用而受到广泛关注。
- 数据集来源于2011年和2012年Capital Bikeshare系统的历史日志,位于美国华盛顿D.C.。
数据集内容
- 数据集包含小时和日两种粒度的自行车租赁数据,以及相应的天气和季节信息。
- 数据集包括两个文件:
hour.csv:每小时自行车租赁计数,记录数为17379小时。day.csv:每日自行车租赁计数,记录数为731天。
数据集特征
- 两个文件共有的字段包括:
instant: 记录索引dteday: 日期season: 季节(1:春季, 2:夏季, 3:秋季, 4:冬季)yr: 年份(0: 2011, 1:2012)mnth: 月份(1至12)hr: 小时(仅在hour.csv中,0至23)holiday: 是否假日weekday: 星期几workingday: 是否工作日weathersit: 天气状况temp: 归一化温度atemp: 归一化体感温度hum: 归一化湿度windspeed: 归一化风速casual: 临时用户计数registered: 注册用户计数cnt: 总租赁自行车计数
相关任务
- 回归分析:预测基于环境及时节设置的小时或日自行车租赁数量。
- 事件和异常检测:利用租赁自行车数量与城市事件的相关性,验证异常或事件检测算法。
许可证与引用
- 使用此数据集的研究必须引用以下出版物:
- Fanaee-T, Hadi, and Gama, Joao, "Event labeling combining ensemble detectors and background knowledge", Progress in Artificial Intelligence (2013): pp. 1-15, Springer Berlin Heidelberg, doi:10.1007/s13748-013-0040-3.
联系方式
- 数据集作者:Hadi Fanaee-T (hadi.fanaee@fe.up.pt)
搜集汇总
数据集介绍

构建方式
Bike Sharing Dataset的构建基于华盛顿特区Capital Bikeshare系统在2011年和2012年的历史租赁数据。数据以小时和天为单位进行聚合,并整合了相应的天气和季节信息。天气数据来源于Freemeteo网站,而节假日信息则从华盛顿特区官方网站获取。通过这种方式,数据集不仅捕捉了自行车租赁的基本信息,还融入了环境与季节性因素,为研究提供了多维度的视角。
特点
该数据集的特点在于其丰富的时间与环境变量,涵盖了季节、天气、温度、湿度、风速等多种因素。数据以小时和天为单位分别记录,便于进行不同时间尺度的分析。此外,数据集还区分了注册用户和临时用户的租赁行为,为研究用户行为模式提供了详细的数据支持。其多维度的特征使得该数据集在预测租赁需求、事件检测等任务中具有广泛的应用潜力。
使用方法
Bike Sharing Dataset可用于多种机器学习任务,如回归分析和异常检测。在回归任务中,研究者可以利用环境与季节性变量预测每小时或每天的自行车租赁数量。在异常检测任务中,数据可用于验证算法对城市重要事件的识别能力,例如通过租赁数量的异常波动检测自然灾害或大型活动。数据集以CSV格式提供,便于使用常见的数据分析工具进行加载和处理。
背景与挑战
背景概述
Bike Sharing Dataset是由葡萄牙波尔图大学人工智能与决策支持实验室(LIAAD)的Hadi Fanaee-T于2013年创建的。该数据集主要基于华盛顿特区的Capital Bikeshare系统在2011年至2012年间的历史租赁数据,并结合了天气和季节信息。自行车共享系统作为新一代的自动租赁服务,在全球范围内迅速普及,其数据不仅对交通、环境和健康问题具有重要意义,还为城市流动性研究提供了独特的视角。该数据集的核心研究问题在于通过环境与季节性因素预测自行车租赁需求,并探索城市事件与异常检测的可能性。其研究成果发表在《Progress in Artificial Intelligence》期刊上,对智能交通系统和城市数据分析领域产生了深远影响。
当前挑战
Bike Sharing Dataset在解决自行车租赁需求预测问题时面临多重挑战。首先,租赁行为受到多种复杂因素的影响,如天气、季节、节假日等,这些因素的交互作用增加了预测模型的复杂性。其次,数据的时间序列特性要求模型能够捕捉长期趋势与短期波动之间的平衡。在构建数据集的过程中,研究人员需从多个来源整合数据,包括租赁记录和天气信息,这一过程涉及数据清洗、归一化和特征提取等技术难题。此外,如何利用该数据集进行城市事件与异常检测也是一个重要挑战,需要结合背景知识开发高效的算法以识别特定事件对租赁行为的影响。
常用场景
经典使用场景
Bike Sharing Dataset 在交通与环境研究领域具有广泛的应用,尤其是在预测共享单车租赁需求方面。该数据集通过记录华盛顿特区Capital Bikeshare系统两年内的租赁数据,结合天气、季节和时间等环境因素,为研究者提供了丰富的时间序列数据。经典的使用场景包括基于回归模型的租赁量预测,研究者可以利用这些数据构建模型,预测不同时间段内的单车租赁数量,从而为共享单车系统的运营优化提供数据支持。
衍生相关工作
基于Bike Sharing Dataset,许多经典研究工作得以展开。例如,研究者开发了多种回归模型和机器学习算法,用于预测共享单车的租赁需求。此外,该数据集还被用于事件检测算法的验证,如通过租赁量的异常变化识别城市中的突发事件。这些研究不仅推动了共享单车系统的发展,也为其他交通系统的智能化管理提供了借鉴。
数据集最近研究
最新研究方向
在共享单车系统的研究中,Bike Sharing Dataset为探索城市交通、环境与健康问题提供了丰富的数据支持。近年来,研究者们利用该数据集在回归分析和事件检测方面取得了显著进展。通过分析天气、季节等环境因素对单车租赁行为的影响,研究者能够精准预测每小时或每日的租赁量,为城市交通管理提供决策依据。此外,该数据集还被广泛应用于异常事件检测,如通过租赁量的波动识别城市中的重大事件,如自然灾害或大型活动。这些研究不仅提升了共享单车系统的运营效率,也为城市规划和应急响应提供了数据驱动的解决方案。
以上内容由遇见数据集搜集并总结生成



