VelibDataSet
收藏github2022-03-15 更新2024-05-31 收录
下载链接:
https://github.com/Phyks/VelibDataSet
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从巴黎自行车共享系统Velib API定期获取的数据,存储在SQLite数据库中,包括站点信息、自行车和站点的实时状态以及站点事件记录。
This dataset comprises data regularly retrieved from the Velib API of the Paris bike-sharing system, stored in an SQLite database. It includes station information, real-time statuses of bikes and stations, as well as records of station events.
创建时间:
2015-09-26
原始信息汇总
数据集概述
数据来源
- 数据集来源于巴黎的共享单车系统Velib API。
数据采集
- 数据通过脚本定期从Velib API获取,并存储在SQLite数据库中。
- 数据库文件每周更新一次,按年份和周数组织。
数据结构
- 数据库包含三个主要表:
stations:包含每个站点的固定信息,如纬度、经度、停车位数量等。stationsstats:记录每个站点在不同时间的可用自行车和停车位数量,数据直接从API获取,包含时间戳。stationsevents:记录stations表中字段的变更,如移动站点的位置变化或停车位数量的增减。
数据可视化
- 提供脚本可将数据库中的数据转换为PNG图像序列,进一步可使用ffmpeg或avconv工具转换为视频。
搜集汇总
数据集介绍

构建方式
VelibDataSet的构建基于巴黎自行车共享系统Velib的API数据,通过定期调用API获取实时信息,并利用pybikes库将数据存储至SQLite数据库中。数据按年份和周期分文件夹存储,每周生成一个新的SQLite文件,文件内包含三个主要表格:`stations`记录站点静态信息,`stationsstats`记录站点实时状态,`stationsevents`记录站点信息的变更历史。
特点
该数据集的特点在于其高时间分辨率和结构化存储方式。数据以分钟级频率更新,涵盖站点位置、可用自行车数量及站点状态变化等详细信息。SQLite文件的按周分割和按年分类存储方式,便于数据管理和长期分析。此外,`stationsevents`表格的设计使得站点变更历史得以完整记录,为研究站点动态变化提供了重要支持。
使用方法
使用VelibDataSet时,用户需克隆代码库并安装pybikes依赖库,随后运行Python脚本以生成数据。数据存储于SQLite文件中,用户可通过SQL查询或可视化脚本分析数据。可视化脚本支持将数据转换为PNG图像序列,并可进一步利用ffmpeg工具生成视频,便于动态展示站点状态变化。
背景与挑战
背景概述
VelibDataSet数据集聚焦于巴黎的公共自行车共享系统Velib,旨在通过定期从Velib API中提取数据,为城市交通研究提供支持。该数据集由Phyks等研究人员于2010年代初期创建,主要依托于pybikes库实现数据的周期性存储。其核心研究问题在于如何高效地捕捉和分析城市自行车共享系统的动态变化,包括车站位置、自行车可用性等关键信息。该数据集为城市交通规划、共享经济模式研究以及智能交通系统开发提供了宝贵的数据资源,推动了相关领域的实证研究和技术创新。
当前挑战
VelibDataSet在解决城市自行车共享系统动态监测问题时面临多重挑战。首先,数据采集的实时性与完整性难以兼顾,API返回的数据量庞大且更新频繁,如何高效存储和处理这些数据成为一大难题。其次,数据结构的复杂性增加了分析的难度,例如车站信息的动态更新需要通过多表关联才能准确追踪。此外,数据可视化过程中,如何将海量时空数据转化为直观的动态图像,也对算法和计算资源提出了较高要求。这些挑战不仅考验了数据处理技术的极限,也为未来城市交通数据集的构建提供了重要的经验借鉴。
常用场景
经典使用场景
VelibDataSet数据集主要用于研究巴黎公共自行车系统的使用模式和动态变化。通过定期从Velib API中提取数据,研究者可以分析自行车站点的使用频率、自行车和停车位的可用性变化,以及站点位置的调整情况。这些数据为城市交通规划、共享经济模式研究提供了宝贵的信息。
实际应用
在实际应用中,VelibDataSet被广泛用于优化巴黎公共自行车系统的运营策略。城市交通管理部门利用这些数据调整自行车站点的分布和数量,提高系统的使用效率。此外,数据还被用于开发智能交通应用,帮助用户实时查询自行车和停车位的可用性,提升用户体验。
衍生相关工作
基于VelibDataSet,许多相关研究工作得以展开。例如,研究者开发了基于机器学习的预测模型,用于预测自行车站点的需求变化;还有研究利用这些数据分析了共享单车对城市交通拥堵的影响。这些衍生工作不仅丰富了数据集的应用场景,也为城市交通研究提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成



