fatal_traffic_accidents_in_the_city_of_madrid_2024
收藏Hugging Face2025-09-05 更新2025-09-06 收录
下载链接:
https://huggingface.co/datasets/dcdc-upm/fatal_traffic_accidents_in_the_city_of_madrid_2024
下载链接
链接失效反馈官方服务:
资源简介:
本数据集包含2024年马德里市发生的致命交通事故数据。数据来源于马德里市政府发布的官方交通事故记录,并仅包含导致人员死亡的交通事故。数据集分为三个配置(第一学期、全年、第二学期)和三个不同的分割(所有、撞击、其他原因)。README文件还说明了如何使用数据集,并提供了使用HuggingFace Dataset库加载数据的Python代码示例。
This dataset contains data on fatal traffic accidents that occurred in Madrid, Spain, in 2024. The data is sourced from official traffic accident records published by the Madrid City Government, and only includes traffic accidents that resulted in human fatalities. The dataset is divided into three configurations (First Semester, Full Year, Second Semester) and three distinct splits (All, Impact, Other Causes). The README file also explains how to use the dataset and provides Python code examples for loading the data using the HuggingFace Dataset library.
创建时间:
2025-09-01
原始信息汇总
数据集概述
基本信息
- 数据集名称:Fatal traffic accidents in the city of Madrid during 2024 (Dataset Publication Tutorial)
- 语言:西班牙语
- 标签:交通、马德里
- 许可证:city-of-madrid-open-data-portal(https://datos.madrid.es/egob/catalogo/aviso-legal)
数据集摘要
该数据集包含2024年马德里市致命交通事故记录,源自马德里市议会发布的原始数据集,仅筛选导致人员死亡的交通事故(lesividad代码为04)。数据集旨在促进马德里高风险事故区域(黑点)的分析,并助力减少道路 fatalities。
数据集配置
数据集提供三种配置,每种配置包含三个分割:
First Semester
- 总样本数:14
- 分割:
- all:7,214字节,14个样本
- atropellos:1,779字节,7个样本
- otros:1,828字节,7个样本
- 下载大小:29,158字节
Full Year
- 总样本数:29
- 分割:
- all:15,094字节,29个样本
- atropellos:4,152字节,16个样本
- otros:3,395字节,13个样本
- 下载大小:31,886字节
Second Semester
- 总样本数:15
- 分割:
- all:7,881字节,15个样本
- atropellos:2,374字节,9个样本
- otros:1,567字节,6个样本
- 下载大小:29,385字节
数据结构
数据集包含20个特征列:
- original_row_index:原始数据集行索引(int64)
- num_expediente:事故编号(字符串)
- fecha:日期(时间戳)
- hora:时间(字符串)
- localizacion:位置描述(字符串)
- numero:街道号码(字符串)
- cod_distrito:区域代码(int64)
- distrito:区域名称(字符串)
- tipo_accidente:事故类型(字符串)
- estado_meteorológico:天气条件(字符串)
- tipo_vehiculo:车辆类型(字符串)
- tipo_persona:人员类型(字符串)
- rango_edad:年龄范围(字符串)
- sexo:性别(字符串)
- cod_lesividad:伤害严重程度代码(float64)
- lesividad:伤害严重程度描述(字符串)
- coordenada_x_utm:X坐标(UTM投影)(float64)
- coordenada_y_utm:Y坐标(UTM投影)(float64)
- positiva_alcohol:酒精检测结果(字符串)
- positiva_droga:毒品检测结果(float64)
数据来源与处理
- 原始数据:马德里市议会2024年交通事故记录(https://datos.madrid.es/portal/site/egob/menuitem.c05c1f754a33a9fbe4b2e4b284f1a5a0/?vgnextoid=7c2843010d9c3610VgnVCM2000001f4a900aRCRD&vgnextchannel=374512b9ace9f310VgnVCM100000171f5a0aRCRD&vgnextfmt=default)
- 处理方式:从原始数据集中提取lesividad代码为04的致命事故记录
- 数据维护:本数据集为教程用途,无更新计划;最新数据请参考马德里开放数据门户
使用方式
python from datasets import load_dataset dataset = load_dataset("dcdc-upm/fatal_traffic_accidents_in_the_city_of_madrid_2024", "Full Year", split="all")
致谢
由马德里自治区教育、科学与大学部的Predoctoral Grant(PIPF-2022/COM-25947)支持。
搜集汇总
数据集介绍

构建方式
在交通安全研究领域,精确的数据采集与处理至关重要。该数据集源自马德里市政府公开的2024年交通事故原始记录,通过严格筛选致死性事故数据构建而成。具体而言,基于事故伤害程度字段(lesividad)中代码为'04'的记录,采用数据提取技术保留原始数据结构,同时新增原始行索引字段以确保数据可追溯性。所有数据处理脚本均遵循开源规范,完整记录于配套的教程资源库中。
特点
该数据集呈现多维度的交通事故特征,涵盖时间、空间、环境及人员等多重属性。每条记录精确包含事故编号、发生时间、地理坐标、行政区划、天气状况、事故类型、车辆类别、人员类型、年龄区间、性别分布及酒精药物检测结果等20个结构化字段。特别值得注意的是,数据集采用UTM坐标系统提供精准地理位置信息,并通过分季度配置实现时序分析的灵活性,为城市交通安全研究提供高粒度数据支撑。
使用方法
研究人员可通过HuggingFace数据集库直接加载该资源,支持按年度或半年度配置灵活选择数据范围。数据集提供三种分割方式:全部事故、行人碰撞事故及其他类型事故,满足不同研究场景的需求。使用示例代码可快速导入完整年度数据,结合Python数据分析工具链进行时空模式分析、高风险区域识别或致因因素挖掘。所有数据均保留原始字段结构和编码体系,确保分析结果与官方数据的一致性。
背景与挑战
背景概述
马德里市2024年致命交通事故数据集源于城市交通安全研究的迫切需求,由马德里市政府与马德里理工大学研究团队联合构建,旨在通过数据科学方法识别交通事故黑点并推动道路安全政策优化。该数据集基于马德里开放数据门户的原始事故记录,经筛选仅保留致死性事故案例,涵盖时间、地点、事故类型、人员特征等多维字段,为交通伤亡模式分析与预防策略制定提供了关键数据支撑。
当前挑战
该数据集需解决交通事故致死因素的多维度关联分析挑战,包括时空分布模式识别、人车环境交互复杂性解析以及酒精药物影响量化等问题。构建过程中面临原始数据异构性整合、隐私信息脱敏处理与地理坐标系统一化等挑战,同时需确保数据筛选逻辑与官方致死判定标准的一致性。
常用场景
经典使用场景
在城市交通安全的学术研究领域,该数据集被广泛应用于致命性交通事故的空间分布模式分析。研究者通过地理坐标信息识别事故高发区域,结合时间序列数据探索昼夜及季节性规律,并利用多维度特征(如天气状况、车辆类型、人员属性)构建事故致因模型。这种分析为理解城市交通系统的脆弱性提供了实证基础。
衍生相关工作
基于该数据集衍生的经典研究包括:基于UTM坐标的空间点模式分析模型,融合气象要素的事故风险预测算法,以及针对弱势道路使用者(行人/骑行者)的保护策略研究。这些成果推动了《Accident Analysis & Prevention》等期刊多篇高被引论文的发表,构建了城市交通安全研究的方法论体系。
数据集最近研究
最新研究方向
在城市交通安全研究领域,马德里致命交通事故数据集正推动着空间分析与人工智能的深度融合。研究者们借助UTM坐标系统构建高精度地理信息模型,结合时间序列分析揭示事故发生的时空规律。当前前沿研究聚焦于多模态数据融合,将气象条件、车辆类型与人员属性等变量纳入深度学习框架,旨在构建更精准的事故风险预测系统。随着欧盟2030年道路安全战略的实施,该数据集成为评估城市安全政策效果的关键基准,特别是在酒精与药物检测数据支持下,为制定针对性干预措施提供了科学依据。这类研究不仅促进了智慧交通系统的发展,更为全球大都市的交通安全治理提供了可复用的分析范式。
以上内容由遇见数据集搜集并总结生成



