european-bike-sharing-dataset
收藏github2025-07-15 更新2025-07-17 收录
下载链接:
https://github.com/TUMFTM/european-bike-sharing-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自欧洲267个自行车共享计划的完整关系数据导出,涵盖4300万公里和88000辆自行车。数据集包括自行车、自行车类型、城市、城市区域、站点、站点状态和行程等多个CSV文件,用于支持分析和建模。
This dataset encompasses comprehensive relational data exports from 267 European bike-sharing programs, covering 43 million kilometers and 88,000 bicycles. The dataset includes multiple CSV files, detailing bicycles, bike types, cities, urban regions, stations, station statuses, and trips, and is intended to support analysis and modeling.
创建时间:
2025-07-14
原始信息汇总
欧洲共享单车数据集概述
数据集基本信息
- 名称:European Bike-Sharing Dataset
- 规模:43百万公里骑行数据,2.3 GiB压缩文件
- 数据格式:CSV
- 时间戳格式:Unix epoch秒(UTC)
- 坐标系统:WGS-84 (EPSG:4326)
作者信息
| 姓名 | 所属机构 | 邮箱 | 备注 |
|---|---|---|---|
| Felix Waldner* | 慕尼黑工业大学汽车技术研究所 | f.waldner@tum.de | *通讯作者,同等贡献 |
| Georg Balke | 慕尼黑工业大学汽车技术研究所 | georg.balke@tum.de | 同等贡献 |
| Felix Rech | 慕尼黑工业大学计算与信息技术学院 | - | - |
| Martin Lellep | 爱丁堡大学物理与天文学院 | - | - |
数据文件结构
完整数据集
bikes.csv(≈88k行)bike_types.csv(≈121行)cities.csv(267行)city_areas.csv(267行,含WKT/WKB/GeoJSON几何数据)stations.csv(≈13k行)station_status.csv(≈38M行,1.7 GiB未压缩)trips.csv(≈25M行,2.7 GiB未压缩)
样本数据集
- 每个文件前1000行
数据模型详情
trips.csv (25,210,627行)
- 包含骑行起始/结束时间、坐标、站点ID、电池状态、持续时间和距离等字段
cities.csv (267行)
- 包含城市名称、坐标、时区、国家代码和运营规则等字段
city_areas.csv (267行)
- 包含城市运营区域的几何数据(EWKB/EWKT/GeoJSON格式)
bike_types.csv (121行)
- 包含单车类型、图像URL、技术规格(载客量、动力类型、电池容量等)信息
bikes.csv (88,444行)
- 包含单车ID、类型ID和车载计算机ID
stations.csv (13,192行)
- 包含站点ID、城市ID、名称、位置和停车设施等信息
station_status.csv (38,279,885行)
- 包含站点实时状态(可用单车数量、空置停车位、维护状态等)
使用许可
- 许可证:CC BY-NC 4.0
- 引用格式: bibtex @article{waldnerbalke2025, title={Data-Driven Insights into (E-)Bike-Sharing...}, author={Waldner, Felix and Balke, Georg et al.}, year={2025}, journal={Transportation} }
联系方式
- Felix Waldner: f.waldner@tum.de
- Georg Balke: georg.balke@tum.de
- 慕尼黑工业大学汽车技术研究所: sekretariat.ftm@ed.tum.de
搜集汇总
数据集介绍

构建方式
该数据集构建于欧洲共享单车系统的实际运营数据之上,通过多源异构数据整合形成完整的时空关系网络。研究团队采用PostgreSQL数据库进行原始数据清洗和转换,运用DBSCAN算法对城市运营区域进行空间聚类,最终生成包含43百万公里行程记录的标准化CSV文件。数据采集过程严格遵循时空一致性原则,所有时间戳采用UTC标准秒计时,地理坐标统一为WGS-84坐标系,并通过EWKB/EWKT/GeoJSON三种格式存储空间几何数据。
特点
作为目前欧洲最全面的共享单车数据集,其核心价值体现在多维度的时空特征融合。数据集包含267个城市的运营数据,涵盖2500万次行程记录和3800万条站点状态快照,精确记录了包括电池状态、车辆类型、站点容量等精细化指标。特别值得注意的是,数据集创新性地整合了电动单车与普通单车的混合运营数据,通过车辆类型表详细标注了121种车型的技术参数,为新型交通能源研究提供了独特视角。空间数据方面,采用标准化地理编码实现了行程轨迹与城市行政边界的精确匹配。
使用方法
该数据集推荐在PostGIS空间数据库环境中进行深度分析,研究者可通过ogr2ogr工具实现CSV到空间数据库的高效转换。对于初步探索性分析,数据集提供了精简的千行样本文件,支持使用Pandas和GeoPandas进行快速原型开发。典型分析流程包括:将EWKB格式的几何字段转换为空间对象,基于城市时区配置统一时间参照系,以及利用PostGIS函数计算空间距离等指标。数据集的关系型结构设计特别适合进行跨表连接分析,例如将行程数据与站点状态、车辆类型进行关联,以研究不同车型的时空使用模式。
背景与挑战
背景概述
欧洲共享单车数据集(European Bike-Sharing Dataset)由慕尼黑工业大学汽车技术研究所的Felix Waldner、Georg Balke等研究人员于2025年构建,旨在为共享单车系统的使用模式和城市特征提供数据驱动的深入分析。该数据集涵盖了43百万公里的骑行记录,包含267个城市的共享单车运营数据,涉及车辆类型、站点状态、行程记录等多维度信息。作为Springer Transportation期刊的配套数据集,其规模与完整性为城市交通规划、可持续出行政策制定以及共享经济模式优化提供了重要的实证基础。数据集通过关系型数据结构整合了时空轨迹、电池状态等关键指标,显著推进了智能交通系统领域的量化研究进程。
当前挑战
该数据集主要解决共享单车系统运营效率与城市空间适配性评估的复杂性问题。领域层面需应对多源异构数据的时空对齐挑战,包括不同城市时区转换、自由浮动车辆轨迹补全,以及电动单车电池状态对行程规划的动态影响。构建过程中面临数据清洗的技术难题,如处理3800万条站点状态记录中的异常值,统一13,192个站点的地理编码标准,并确保88,444辆单车与121种车型的关联完整性。海量数据(2.3GiB压缩)的分布式处理与PostgreSQL空间数据库优化,进一步增加了数据集的构建复杂度。
常用场景
经典使用场景
在共享单车系统的研究中,european-bike-sharing-dataset被广泛用于分析用户骑行行为模式及其与城市空间特征的关联。通过整合超过2500万次骑行记录和3800万条站点状态数据,研究人员能够深入挖掘不同时间尺度下的骑行需求变化,揭示城市热点区域的时空分布规律,为优化车辆调度算法提供数据支撑。
解决学术问题
该数据集有效解决了城市交通研究中共享单车系统动态建模的难题。其精确到秒级的时间戳和地理坐标数据,使得学者能够量化分析电动自行车与传统自行车在续航里程、使用频率等方面的差异,同时通过多城市对比研究,验证了气候、地形等环境因素对共享单车系统运营效率的影响机制。
衍生相关工作
基于该数据集衍生的经典研究包括慕尼黑工业大学开发的时空预测模型BikeFlow,其通过融合气象数据实现了骑行需求的高精度预测。爱丁堡大学团队则利用几何网络分析方法,发表了关于共享单车系统对缓解城市交通拥堵效应的量化研究,这些成果均发表在交通领域的顶级期刊上。
以上内容由遇见数据集搜集并总结生成



