five

fatal_traffic_accidents_in_the_city_of_madrid_2024

收藏
Hugging Face2025-09-04 更新2025-09-05 收录
下载链接:
https://huggingface.co/datasets/iguillenp/fatal_traffic_accidents_in_the_city_of_madrid_2024
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了2024年马德里市发生的致命交通事故数据。数据来源于马德里市政府发布的原始数据集,仅选择了导致人员死亡的交通事故。数据集分为三个配置(全年、上半年、下半年)和三个分割(碰撞、其他、全部)。数据集结构包括事故详情、天气状况、车辆类型等多个特征,旨在帮助分析高风险事故区域。
创建时间:
2025-09-01
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Fatal traffic accidents in the city of Madrid during 2024 (Dataset Publication Tutorial)
  • 语言: 西班牙语
  • 标签: 交通、马德里
  • 许可证: City of Madrid Open Data Portal(https://datos.madrid.es/egob/catalogo/aviso-legal)

数据集摘要

该数据集包含2024年马德里市致命交通事故记录,源自马德里市议会发布的原始数据集,仅筛选导致人员死亡的交通事故(lesividad代码为04)。数据集旨在促进马德里高风险事故区域(黑点)分析,助力减少道路 fatalities。

数据集配置

数据集提供三种配置,每种配置包含三个分割:

First Semester

  • 总样本数: 14
  • 分割:
    • all: 14条样本,3607字节
    • atropellos: 7条样本,1779字节
    • otros: 7条样本,1828字节
  • 下载大小: 29158字节
  • 数据集大小: 7214字节

Full Year

  • 总样本数: 29
  • 分割:
    • all: 29条样本,7547字节
    • atropellos: 16条样本,4152字节
    • otros: 13条样本,3395字节
  • 下载大小: 31886字节
  • 数据集大小: 15094字节

Second Semester

  • 总样本数: 15
  • 分割:
    • all: 15条样本,3940字节
    • atropellos: 9条样本,2374字节
    • otros: 6条样本,1567字节
  • 下载大小: 29385字节
  • 数据集大小: 7881字节

数据结构

数据集包含20个特征字段:

  1. original_row_index: 原始数据集行索引(int64)
  2. num_expediente: 事故编号,格式为AAAASNNNNNN(string)
  3. fecha: 日期,格式dd/mm/yyyy(timestamp[ns])
  4. hora: 时间,按1小时范围表示(string)
  5. localizacion: 位置描述,街道1-街道2(交叉口)或单条街道(string)
  6. numero: 街道号码(string)
  7. cod_distrito: 区域代码(int64)
  8. distrito: 区域名称(string)
  9. tipo_accidente: 事故类型(string)
  10. estado_meteorológico: 天气条件描述(string)
  11. tipo_vehiculo: 涉及车辆类型(string)
  12. tipo_persona: 涉及人员类型(string)
  13. rango_edad: 受影响人员年龄范围(string)
  14. sexo: 性别:男性、女性或未分配(string)
  15. cod_lesividad: 严重程度代码(float64)
  16. lesividad: 严重程度描述(string)
  17. coordenada_x_utm: X坐标(UTM投影)(float64)
  18. coordenada_y_utm: Y坐标(UTM投影)(float64)
  19. positiva_alcohol: 酒精检测结果:N(否)或S(是)(string)
  20. positiva_droga: 药物检测结果:NULL或1(float64)

数据来源与处理

  • 原始数据: 马德里市议会2024年交通事故记录(https://datos.madrid.es/portal/site/egob/menuitem.c05c1f754a33a9fbe4b2e4b284f1a5a0/)
  • 处理方式: 从原始数据集中提取lesividad代码为04的致命事故记录
  • 数据处理代码: https://github.com/iguillenp/dataset-publication-tutorial

使用方式

python from datasets import load_dataset dataset = load_dataset("iguillenp/fatal_traffic_accidents_in_the_city_of_madrid_2024", "Full Year", split="all")

维护政策

原始数据集由马德里市议会维护并定期更新,本转换数据集为教程用途,由相关教学团队维护,除教程版本修订外无进一步更新计划。

引用

  • 原始数据集: Ayuntamiento de Madrid. Accidentes de tráfico en la ciudad de Madrid (2024). Portal de Datos Abiertos. https://datos.madrid.es/portal/site/egob
  • 转换数据集: Guillén-Pacho I. (2025). Fatal Traffic Accidents in the city of Madrid 2024 [Data set]. HuggingFace. https://huggingface.co/datasets/iguillenp/fatal_traffic_accidents_in_the_city_of_madrid_2024

资助

本研究由马德里自治区教育、科学与大学部的Predoctoral Grant (PIPF-2022/COM-25947)支持。

搜集汇总
数据集介绍
main_image_url
构建方式
在交通工程与公共安全研究领域,马德里市致命交通事故数据集基于市政府公开的2024年交通事故原始记录构建。通过精确筛选原始数据中伤害严重程度编码为04(24小时内死亡)的个案,保留完整的字段结构与坐标信息,并添加原始行索引以支持数据溯源。数据处理采用可复现的脚本流程,确保学术研究的透明性与数据完整性。
特点
该数据集涵盖时间、地理坐标、事故类型、天气条件、车辆类型、人员属性及毒酒精检测等多维特征,具备精确的空间定位能力。其独特价值在于聚焦致命性事故的深度标注,包括行人碾压、多车碰撞等细分类型,并保留UTM坐标系统以供地理空间分析。数据分设全年、上下半年三种时间配置及事故类型分划,支持多维度的对比研究。
使用方法
研究者可通过HuggingFace平台直接加载数据集,选择全年或分时段配置开展分析。建议结合地理信息系统进行事故黑点空间聚类,或利用机器学习方法挖掘气象、时间因素与事故严重性的关联模式。数据字段包含标准化编码与描述性文本,需注意人员类型与伤害程度的交叉分析应以单条记录对应单个参与者为基础展开。
背景与挑战
背景概述
马德里市2024年致命交通事故数据集源于城市交通安全研究的迫切需求,由马德里市政府主导创建,Ibai Guillén-Pacho等人基于开放数据门户的原始记录进行重构。该数据集聚焦于通过空间时间维度分析事故黑点分布规律,旨在为城市规划与交通安全政策提供数据支撑,其多维度属性记录涵盖了事故类型、人员损伤程度及环境因素等关键变量,对提升城市交通治理智能化水平具有显著价值。
当前挑战
该数据集需解决交通事故致死模式识别与高风险区域预测的核心问题,其挑战在于多源异构数据的融合分析,包括时空坐标与事故特征的关联建模,以及酒精药物检测等稀疏数据的有效利用。构建过程中面临原始数据字段语义不一致、伤亡严重性编码转换的精度损失,以及隐私信息脱敏与地理坐标匿名化之间的平衡难题。
常用场景
经典使用场景
在城市交通安全研究领域,该数据集被广泛应用于致命交通事故的空间聚类分析与时间模式挖掘。研究者通过地理坐标字段进行事故热力图绘制,结合时间戳与天气条件字段分析事故发生的时空分布规律,为城市道路安全评估提供数据支撑。
衍生相关工作
基于该数据集衍生的经典研究包括《马德里都市区事故黑点时空演化模型》等论文,这些工作通过机器学习方法构建了事故预测系统。后续研究者进一步开发了融合气象数据与交通流量的多模态分析框架,推动了智能交通管理系统在欧洲城市的应用实践。
数据集最近研究
最新研究方向
随着智慧城市与交通安全研究的深度融合,马德里致命交通事故数据集为城市安全分析提供了关键数据支撑。当前研究聚焦于时空热点模式挖掘,通过地理信息系统与机器学习算法识别事故高发区域及其时空分布规律。学者们正探索多模态数据融合方法,结合气象条件、道路类型与人口统计学特征构建动态风险评估模型。该数据集亦推动政策效果评估研究,通过对比干预前后事故数据变化,为城市交通治理提供实证依据。相关成果已应用于欧盟城市安全倡议,促进智能交通系统与零死亡愿景战略的实施。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作