SimRa Dataset
收藏github2024-05-04 更新2024-05-31 收录
下载链接:
https://github.com/simra-project/dataset
下载链接
链接失效反馈官方服务:
资源简介:
该项目是SimRa研究项目的一部分,专注于收集有关自行车骑行者接近碰撞的数据,以及识别柏林自行车交通的主要路线。通过开发的智能手机应用,使用GPS信息跟踪自行车骑行者的路线,并利用内置加速传感器预分类接近碰撞。用户在骑行后被要求注释并上传收集的伪名化数据。
This project is part of the SimRa research initiative, focusing on gathering data on near-collisions involving cyclists and identifying the main routes for bicycle traffic in Berlin. Utilizing a developed smartphone application, the routes of cyclists are tracked via GPS information, and near-collisions are pre-classified using the built-in accelerometer. Users are prompted to annotate and upload the collected pseudonymized data after their rides.
创建时间:
2019-08-23
原始信息汇总
SimRa Dataset Overview
Data Source and Distribution
- Data Periods:
- 06/2019 - 12/2020: Available at DepositOnce (06/2019-12/2020)
- 01/2021 - 09/2021: Available at DepositOnce (01/2021-09/2021)
- 10/2021 - 09/2022: Available at DepositOnce (10/2021-09/2022)
- 10/2022 - 07/2023: Available at DepositOnce (10/2022-07/2023)
- Newer data is published in this repository.
Data Content
-
Ride Data:
- File Structure: Each file starts with the app version and file version (
<app version>#<file version>). - Incident Information:
- Header: key, lat, lon, ts, bike, childCheckBox, trailerCheckBox, pLoc, incident, i1-i10, scary, desc
- Details:
- key: Incident number
- lat/lon: GPS location
- ts: Timestamp in milliseconds from epoch
- bike: Type of bicycle
- childCheckBox/trailerCheckBox: Presence of child or trailer
- pLoc: Location of the phone during the ride
- incident: Type of incident
- i1-i10: Other participants involved in the incident
- scary: Indicator if the incident was scary
- desc: Text description of the incident
- Ride Information:
- Header: lat, lon, X, Y, Z, timeStamp, acc, a, b, c, obsDistanceLeft1-2, obsDistanceRight1-2, obsClosePassEvent, XL, YL, ZL, RX, RY, RZ, RC
- Details:
- lat/lon: GPS location
- X/Y/Z: Accelerometer sensor readings
- timeStamp: Timestamp in milliseconds from epoch
- acc: Confidence radius of the location
- a/b/c: Gyroscope sensor readings
- obsDistanceLeft1-2/obsDistanceRight1-2: OpenBikeSensor readings on left and right sides
- obsClosePassEvent: Indicator of close pass event
- XL/YL/ZL: Linear accelerometer values
- RX/RY/RZ/RC: Rotation vector values
- File Structure: Each file starts with the app version and file version (
-
Profile Data:
- Header Variability: Headers may differ between iOS and Android versions.
- Example Header: birth, gender, region, experience, numberOfRides, duration, numberOfIncidents, waitedTime, distance, co2, 0-23, behaviour, numberOfScary
- Details:
- birth: Birth year group
- gender: Gender
- region: Region
- experience: Experience as a cyclist
- numberOfRides: Number of rides uploaded
- duration: Duration of rides uploaded
- numberOfIncidents: Number of incidents uploaded
- waitedTime: Duration waited during rides
- distance: Distance of rides uploaded
- co2: CO2 savings by not driving a car
- 0-23: Distribution of rides through the hours in a day
- behaviour: Adherence to traffic rules
- numberOfScary: Number of scary incidents uploaded
License
- Type: CC BY-NC 4.0
- Commercial Use: Granted for journalistic purposes
- Terms of Use: Prohibits activities that might deanonymize cyclists or infringe privacy rights.
Data Access
- Majority of data is hosted on DepositOnce, with more recent data available on GitHub.
搜集汇总
数据集介绍

构建方式
SimRa数据集的构建依托于SimRa研究项目,通过开发适用于Android和iOS的智能手机应用程序,收集骑行者的GPS信息和内置加速度传感器数据。该应用程序能够预分类潜在的近碰撞事件,并在骑行结束后,用户可以对收集的数据进行注释和上传,确保每段骑行数据在传输前经过伪匿名化处理。数据集的构建过程严格遵循数据保护和隐私原则,旨在识别骑行者在特定时间和地点的风险,并分析柏林及其他地区的主要骑行路线。
特点
SimRa数据集的显著特点在于其多维度的数据结构,涵盖了骑行路线、近碰撞事件、用户注释以及骑行者的基本人口统计信息。数据集通过GPS和传感器数据精确记录骑行轨迹和环境变化,同时用户注释提供了对事件的主观评价,增强了数据的人文维度。此外,数据集的伪匿名化处理确保了用户隐私,使其在学术研究和政策制定中具有高度的应用价值。
使用方法
SimRa数据集适用于多种研究场景,包括但不限于城市交通规划、骑行安全分析和用户行为研究。使用者可以通过下载不同时间段的骑行数据,结合GPS轨迹、加速度传感器读数和用户注释,进行深入分析。数据集的开放性和详细的字段说明,使得研究者能够轻松提取和处理所需信息,进行统计分析、可视化展示或机器学习模型的训练。使用时需遵守数据集的非商业许可和隐私保护条款,确保数据的合法和道德使用。
背景与挑战
背景概述
SimRa数据集是由SimRa研究项目生成的,该项目专注于通过智能手机应用程序收集自行车骑行者的近碰撞数据,以识别骑行风险较高的区域和主要骑行路线。该项目始于2019年,由柏林数字未来研究中心主导,结合了Android和iOS平台的应用程序,通过GPS和内置加速度传感器记录骑行数据,并在用户完成骑行后进行匿名化上传。SimRa数据集的核心研究问题在于通过分析这些数据,提升城市骑行安全,优化骑行基础设施,并对相关领域的研究提供了宝贵的实证数据。
当前挑战
SimRa数据集在构建过程中面临多重挑战。首先,如何在保护用户隐私的前提下,有效收集和处理大量骑行数据是一个关键问题。其次,数据集的多样性和代表性也是一个挑战,确保不同地区、不同骑行经验和不同年龄段的数据都能被充分代表。此外,数据的质量和准确性,特别是在处理GPS信号漂移和传感器误差时,也是一个需要解决的问题。最后,如何有效地将这些数据转化为可操作的建议,以改善城市骑行环境,是该数据集面临的另一大挑战。
常用场景
经典使用场景
SimRa数据集的经典使用场景主要集中在城市自行车交通的安全性分析与优化。通过收集骑行者的GPS轨迹和内置加速度传感器检测到的近似碰撞事件,研究人员能够识别出自行车骑行者在特定时间和地点面临的高风险区域。这些数据为城市规划者提供了宝贵的信息,帮助他们设计更安全的自行车道和交通管理策略。此外,该数据集还可用于开发和验证基于机器学习的自行车事故预测模型,从而进一步提升骑行安全性。
解决学术问题
SimRa数据集解决了城市交通研究中的多个关键学术问题。首先,它为研究人员提供了大规模、真实的骑行数据,使得对自行车交通模式和事故发生率的深入分析成为可能。其次,通过结合GPS和传感器数据,该数据集能够帮助识别影响骑行安全的主要因素,如道路设计、交通流量和天气条件等。这些研究成果不仅丰富了交通工程领域的理论基础,还为政策制定者提供了科学依据,以改善城市骑行环境。
衍生相关工作
SimRa数据集的发布催生了一系列相关研究和工作。首先,基于该数据集的机器学习模型被广泛应用于自行车事故预测和风险评估,显著提升了模型的准确性和实用性。其次,研究人员利用该数据集进行了多维度分析,如骑行者行为模式、道路设计对安全的影响等,推动了交通工程和行为科学领域的交叉研究。此外,SimRa数据集还激发了其他城市和地区开发类似的骑行数据收集平台,进一步扩大了其影响力和应用范围。
以上内容由遇见数据集搜集并总结生成



