five

wypadki

收藏
Hugging Face2025-10-25 更新2025-10-26 收录
下载链接:
https://huggingface.co/datasets/mucherek/wypadki
下载链接
链接失效反馈
官方服务:
资源简介:
包含警察数据库SEWIK数据、GDDKiA 2020年交通流量数据和道路段几何数据的数据集,用于分析交通事故和交通流量。
创建时间:
2025-10-25
原始信息汇总

数据集概述

基本信息

  • 数据集名称: wypadki
  • 数据来源: 波兰警方SEWIK数据库 + GDDKiA 2020年交通流量测量数据 + 测量路段道路几何数据
  • 技术栈: DuckDB + SPATIAL扩展

数据表结构

核心数据表

  • zdarzenie - 事件列表(事故/碰撞)
  • pojazd - 参与事件的车辆
  • uczestnik - 事件参与者
  • dane_ruchu - GPR 2020交通流量和测量路段数据
  • drogi_odcinki - 用于生成交通流量数据的SHP数据

数据应用示例

地理数据导出查询

提供将数据导出为GeoJSON格式的示例查询,包含道路编号、长度、事故数量等字段。

驾驶员年龄组分析

按年龄组(低于20岁、18-25岁、26-40岁、41-65岁、高于65岁)分析驾驶员与事故数量的关系,特别关注特定车辆类型(IS221)。

高风险路段识别

识别每公里和每1000辆车事故率最高的路段,包含道路编号、长度、平均交通流量和事故密度计算。

数据导出功能

支持通过COPY命令将包含几何数据的结果导出为GeoJSON格式: COPY <query> TO file.geojson WITH(driver geojson,format gdal);

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于波兰警方SEWIK数据库的交通事故记录,整合了2020年国家道路与高速公路总局的交通流量监测数据,并融合了道路几何形状的空间信息。通过DuckDB数据库系统及其空间扩展模块,将事故记录、车辆信息、参与者数据与道路测量段的空间坐标进行多维度关联,形成统一的结构化数据体系。
特点
数据集具备多源异构数据的深度融合特性,既包含事故时间、车辆品牌、参与者年龄等属性维度,又集成道路线形与交通流量的空间拓扑关系。其独特价值在于通过标准化查询接口,可动态生成事故密度与交通强度的空间关联指标,支持从微观个体行为到宏观路网安全的多尺度分析。
使用方法
用户可通过结构化查询语言提取空间化的交通事故数据,利用COPY命令直接导出符合GeoJSON标准的空间数据文件。典型应用场景包括构建事故热点识别模型,通过年龄分组与车辆品牌的交叉统计揭示风险规律,或结合道路长度与日均流量计算标准化事故率指标,为交通安全研究提供量化依据。
背景与挑战
背景概述
wypadki数据集由波兰警方与道路管理部门于2020年联合构建,整合了SEWIK警务数据库的交通事故记录、GDDKiA交通流量监测数据及道路几何信息。该数据集聚焦于道路安全分析领域,旨在通过多源数据融合揭示交通事故的空间分布规律与风险因素,为交通工程优化和公共安全政策制定提供实证基础。其跨机构协作模式开创了东欧地区交通数据系统化研究的先河,推动了智能交通管理系统的发展。
当前挑战
该数据集面临领域问题与构建过程双重挑战。在领域层面,需解决交通事故多因素耦合分析的复杂性,包括车辆类型、驾驶员年龄、道路几何特征等变量的交互影响;构建过程中,原始数据存在警务记录编码不统一、空间坐标系统异构、交通流量监测段与事故地点匹配精度不足等问题。此外,动态交通环境下的数据时效性维护与隐私保护规范亦构成持续挑战。
常用场景
经典使用场景
在交通安全研究领域,wypadki数据集通过整合警方事故记录与道路几何数据,为分析交通事故空间分布特征提供了关键支持。该数据集常用于构建道路安全风险评估模型,研究者能够识别事故高发路段,并结合交通流量数据计算单位长度事故密度,从而揭示道路设计缺陷与事故频发之间的潜在关联。
实际应用
在智慧交通管理实践中,该数据集被广泛应用于道路安全审计与交通管制策略制定。交通管理部门可通过动态监测事故热点路段,优化限速设置和交通标志布局。保险行业则利用驾驶行为与事故关联分析开发精准定价模型,而城市规划部门可依据事故空间聚类特征改进道路网络设计标准。
衍生相关工作
基于该数据集衍生的经典研究包括融合深度学习与空间统计的事故预测模型,如结合图神经网络的道路风险动态评估系统。在政策研究层面,学者们构建了不同年龄群体驾驶风险画像,推动了分级驾照制度的完善。此外,该数据集还催生了多个开源分析工具链,实现了从原始数据到可视化决策支持系统的端到端解决方案。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作