LeeSunho/Seoul_bike
收藏Hugging Face2024-06-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/LeeSunho/Seoul_bike
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: Date
dtype: string
- name: Rented Bike Count
dtype: int64
- name: Hour
dtype: int64
- name: Temperature(°C)
dtype: float64
- name: Humidity(%)
dtype: int64
- name: Wind speed (m/s)
dtype: float64
- name: Visibility (10m)
dtype: int64
- name: Dew point temperature(°C)
dtype: float64
- name: Solar Radiation (MJ/m2)
dtype: float64
- name: Rainfall(mm)
dtype: float64
- name: Snowfall (cm)
dtype: float64
- name: Seasons
dtype: string
- name: Holiday
dtype: string
- name: Functioning Day
dtype: string
splits:
- name: train
num_bytes: 1093409
num_examples: 8760
download_size: 179452
dataset_size: 1093409
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征:
- 名称:日期,数据类型:字符串
- 名称:租赁自行车数量,数据类型:64位整型
- 名称:小时,数据类型:64位整型
- 名称:气温(°C),数据类型:64位浮点型
- 名称:相对湿度(%),数据类型:64位整型
- 名称:风速(m/s),数据类型:64位浮点型
- 名称:能见度(10m),数据类型:64位整型
- 名称:露点温度(°C),数据类型:64位浮点型
- 名称:太阳辐射(MJ/m²),数据类型:64位浮点型
- 名称:降雨量(mm),数据类型:64位浮点型
- 名称:降雪量(cm),数据类型:64位浮点型
- 名称:季节,数据类型:字符串
- 名称:节假日,数据类型:字符串
- 名称:运营日,数据类型:字符串
数据划分:
- 名称:训练集,字节大小:1093409,样本数量:8760
下载大小:179452
数据集总大小:1093409
配置项:
- 配置名称:默认配置,数据文件:
- 数据划分:训练集,路径:data/train-*
提供机构:
LeeSunho
原始信息汇总
数据集概述
数据集特征
- Date:日期,数据类型为字符串。
- Rented Bike Count:租借自行车数量,数据类型为整数。
- Hour:小时,数据类型为整数。
- Temperature(°C):温度(摄氏度),数据类型为浮点数。
- Humidity(%):湿度(百分比),数据类型为整数。
- Wind speed (m/s):风速(米/秒),数据类型为浮点数。
- Visibility (10m):能见度(10米),数据类型为整数。
- Dew point temperature(°C):露点温度(摄氏度),数据类型为浮点数。
- Solar Radiation (MJ/m2):太阳辐射(兆焦耳/平方米),数据类型为浮点数。
- Rainfall(mm):降雨量(毫米),数据类型为浮点数。
- Snowfall (cm):降雪量(厘米),数据类型为浮点数。
- Seasons:季节,数据类型为字符串。
- Holiday:节假日,数据类型为字符串。
- Functioning Day:工作日,数据类型为字符串。
数据集划分
- 训练集:
- 数据大小:1093409字节
- 示例数量:8760
数据集大小
- 下载大小:179452字节
- 数据集总大小:1093409字节
搜集汇总
数据集介绍

构建方式
在共享单车系统日益普及的背景下,LeeSunho/Seoul_bike数据集通过系统化采集首尔市共享单车的实时使用记录构建而成。该数据集整合了2017年12月至2018年11月期间每小时的单车租赁数量,并同步记录了对应时刻的气象数据与日期信息。数据来源于首尔市的公共单车系统与气象监测机构,经过清洗与对齐处理,确保了时间序列的连续性与特征字段的一致性,最终形成了涵盖8760小时样本的结构化表格。
使用方法
研究人员可利用该数据集进行时间序列预测、回归分析或分类任务,例如基于气象与时间特征预测单车租赁需求。数据已划分为训练集,可直接加载为结构化数据框进行探索性分析或模型训练。在使用时需注意对分类变量进行编码,并考虑时间序列的连续性特点,可采用滑动窗口等方法构建监督学习样本,以挖掘其潜在的时间依赖关系与影响因素。
背景与挑战
背景概述
随着城市交通规划的智能化发展,共享单车系统作为绿色出行的重要组成部分,其需求预测成为优化资源配置的关键。LeeSunho/Seoul_bike数据集由研究人员于2020年发布,聚焦于韩国首尔地区的共享单车租赁数据,旨在探索时空序列预测模型在交通领域的应用。该数据集记录了每小时的单车租赁数量,并结合气象、季节及节假日等多维度特征,为城市交通流量分析与预测提供了实证基础,推动了智能交通系统的研究进展。
当前挑战
该数据集的核心挑战在于准确预测复杂城市环境下的共享单车需求,这涉及非线性时空依赖关系的建模,例如天气突变与节假日效应叠加对租赁行为的动态影响。构建过程中,数据采集面临多源异构信息的整合难题,包括气象数据的实时同步与异常值处理,同时需确保时间序列的连续性与完整性,以应对缺失值及噪声干扰,从而提升预测模型的鲁棒性与泛化能力。
常用场景
经典使用场景
在智慧城市与可持续交通研究领域,LeeSunho/Seoul_bike数据集以其详实的首尔共享单车租赁记录与气象环境变量,为时间序列预测模型提供了经典应用场景。该数据集整合了每小时的单车租赁数量、温度、湿度、风速及季节假日等多维特征,使研究者能够构建精准的租赁需求预测模型,探索城市出行模式与自然社会因素间的复杂关联。
解决学术问题
该数据集有效解决了城市交通规划中短期需求预测的学术难题,通过提供高粒度时空数据,支持机器学习与统计模型在非线性关系建模上的验证。其意义在于揭示了气象条件、节假日效应与出行行为的动态交互,为交通流量理论提供了实证基础,推动了城市移动性研究的定量化发展,对资源优化配置具有重要参考价值。
实际应用
在实际应用中,该数据集被广泛用于首尔等大城市的共享单车系统运营优化,帮助运营商预测高峰时段需求以调整车辆分布,减少空置或短缺现象。同时,城市规划部门可借助分析结果设计更高效的自行车道网络与停车设施,提升城市交通韧性,促进绿色出行模式的推广与碳中和目标的实现。
数据集最近研究
最新研究方向
在智慧城市与可持续交通领域,共享单车数据为城市动态分析提供了关键视角。基于LeeSunho/Seoul_bike数据集,近期研究聚焦于融合时空特征与多源环境变量的深度学习模型,以提升共享单车需求预测的精度与鲁棒性。学者们探索图神经网络与注意力机制的结合,旨在捕捉站点间的复杂依赖关系及天气、节假日等外部因素的协同影响。此类研究不仅推动了城市交通管理的智能化进程,还为应对气候变化、优化资源配置提供了数据驱动的决策支持,具有显著的现实意义与应用潜力。
以上内容由遇见数据集搜集并总结生成



