five

Bike-sharing Dataset

收藏
github2020-10-25 更新2024-05-31 收录
下载链接:
https://github.com/muditpaliwal/UCI_Bike-sharing-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
共享单车租赁过程与环境和季节设置高度相关。例如,天气条件、降水、工作日、季节、一天中的小时等都可能影响租赁行为。核心数据集与Capital Bikeshare系统在2011年和2012年的两年历史日志相对应,该系统位于美国华盛顿特区,并公开提供。我们根据每小时和每天的基础对数据进行了聚合,并提取和添加了相应的天气和季节信息。

The process of bike-sharing rentals is highly correlated with environmental and seasonal settings. For instance, weather conditions, precipitation, weekdays, seasons, and the hour of the day can all influence rental behaviors. The core dataset corresponds to the two-year historical logs from 2011 and 2012 of the Capital Bikeshare system, located in Washington, D.C., USA, and is publicly available. We aggregated the data on an hourly and daily basis and extracted and added corresponding weather and seasonal information.
创建时间:
2020-02-02
原始信息汇总

数据集概述

数据集名称

Bike Sharing Dataset

数据来源

  • 数据集基于2011年和2012年Capital Bikeshare系统的历史日志,该系统位于美国华盛顿D.C.。
  • 天气信息从http://www.freemeteo.com提取。

数据集内容

  • hour.csv: 自行车共享计数按小时聚合。记录数:17379小时。
  • day.csv: 自行车共享计数按日聚合。记录数:731天。

数据集特征

  • 共同字段:
    • instant: 记录索引
    • dteday: 日期
    • season: 季节(1:春季, 2:夏季, 3:秋季, 4:冬季)
    • yr: 年份(0: 2011, 1:2012)
    • mnth: 月份(1至12)
    • holiday: 是否假日
    • weekday: 星期几
    • workingday: 是否工作日
    • weathersit: 天气状况
    • temp: 归一化温度(摄氏度)
    • atemp: 归一化体感温度(摄氏度)
    • hum: 归一化湿度
    • windspeed: 归一化风速
    • casual: 临时用户计数
    • registered: 注册用户计数
    • cnt: 总租赁自行车计数
  • hour.csv额外字段:
    • hr: 小时(0至23)

相关任务

  • 回归: 基于环境和季节设置预测每小时或每日自行车租赁数量。
  • 事件和异常检测: 租赁自行车数量与城市中的某些事件相关,可通过搜索引擎追踪。

引用信息

  • 引用文献: Fanaee-T, Hadi, and Gama, Joao, "Event labeling combining ensemble detectors and background knowledge", Progress in Artificial Intelligence (2013): pp. 1-15, Springer Berlin Heidelberg, doi:10.1007/s13748-013-0040-3.

联系方式

  • 联系人: Hadi Fanaee-T (hadi.fanaee@fe.up.pt)
搜集汇总
数据集介绍
main_image_url
构建方式
Bike-sharing Dataset的构建基于华盛顿特区Capital Bikeshare系统2011至2012年的历史租赁数据。数据集通过聚合每小时和每日的自行车租赁记录,并结合从freemeteo.com获取的天气信息以及季节性数据,形成了一个全面的时间序列数据集。这种构建方式不仅捕捉了租赁行为的时间动态,还考虑了环境因素对租赁行为的影响。
特点
该数据集的特点在于其详细记录了每小时的自行车租赁数量,包括天气状况、温度、湿度和风速等环境因素。此外,数据集还区分了注册用户和临时用户的租赁行为,为研究不同用户群体的行为模式提供了可能。这种多维度的数据特性使得该数据集在交通、环境和健康领域的研究中具有重要价值。
使用方法
Bike-sharing Dataset可用于多种机器学习任务,如回归分析,预测基于环境条件的自行车租赁数量;事件和异常检测,通过分析租赁数量的变化来识别城市中的重要事件或异常情况。研究人员可以利用hour.csv和day.csv文件中的数据,结合天气和季节性信息,进行时间序列分析或构建预测模型,以探索自行车共享系统的使用模式及其影响因素。
背景与挑战
背景概述
Bike-sharing Dataset是由葡萄牙波尔图大学的人工智能与决策支持实验室(LIAAD)的Hadi Fanaee-T等人于2013年创建的。该数据集主要关注共享单车系统的自动租赁过程,记录了用户在特定时间段内的租赁行为,并结合了天气和季节等环境因素。数据集的核心数据来源于华盛顿特区的Capital Bikeshare系统,涵盖了2011年和2012年的历史记录。共享单车系统作为一种新型的城市交通方式,不仅对交通、环境和健康问题具有重要影响,还为城市流动性研究提供了宝贵的数据支持。通过分析这些数据,研究者可以更好地理解城市中的交通模式、事件检测以及异常行为识别。
当前挑战
Bike-sharing Dataset在解决城市交通和环境问题时面临多重挑战。首先,数据集中包含了大量的时间序列数据,如何准确预测每小时或每天的自行车租赁数量是一个复杂的回归问题,尤其是在考虑天气、季节和节假日等多重因素的影响下。其次,数据集的构建过程中,研究者需要从多个来源整合数据,包括天气信息和节假日安排,这增加了数据清洗和预处理的复杂性。此外,数据中的异常事件检测也是一个重要挑战,如何通过算法识别出与城市重大事件相关的租赁行为变化,需要结合背景知识和先进的检测技术。这些挑战不仅考验了数据处理能力,也对模型的泛化能力提出了高要求。
常用场景
经典使用场景
Bike-sharing Dataset 在交通和环境研究领域具有广泛的应用,尤其是在城市交通流量预测和共享单车系统优化方面。该数据集记录了华盛顿特区Capital Bikeshare系统在2011年和2012年间的每小时和每日单车租赁数据,结合了天气、季节和时间等环境因素,为研究者提供了丰富的时间序列数据。通过分析这些数据,研究者可以深入探讨共享单车系统的使用模式及其与城市环境之间的相互作用。
衍生相关工作
基于Bike-sharing Dataset,许多经典研究工作得以展开。例如,研究者利用该数据集开发了基于机器学习的单车租赁预测模型,显著提升了预测精度。此外,该数据集还被用于事件检测算法的研究,如通过分析租赁数据识别城市中的异常事件。这些研究不仅推动了共享单车系统的发展,也为其他交通系统的智能化管理提供了借鉴。
数据集最近研究
最新研究方向
近年来,共享单车数据集在智能交通和城市管理领域的研究中占据了重要地位。随着城市化进程的加速和绿色出行理念的普及,共享单车系统不仅成为解决交通拥堵和环境污染的有效手段,还因其自动化的租赁和归还机制,生成了大量具有研究价值的数据。这些数据记录了用户的出行时间、起始点和目的地,形成了一个虚拟的传感器网络,能够实时感知城市的流动性。当前的研究热点主要集中在利用这些数据进行回归分析,预测不同环境条件下的单车租赁量,以及通过异常检测算法识别城市中的重要事件。例如,通过分析天气、季节和节假日等因素对租赁行为的影响,研究者能够优化单车的调度和分配策略。此外,该数据集还被广泛应用于验证事件检测算法,如通过历史数据识别飓风等极端天气事件对城市交通的影响。这些研究不仅推动了智能交通系统的发展,还为城市规划和应急管理提供了科学依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作