five

xx103/NYC_Motor_Vehicle_Collisions_and_Weather_Dataset

收藏
Hugging Face2024-03-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xx103/NYC_Motor_Vehicle_Collisions_and_Weather_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
NYC Motor Vehicle Collisions and Weather Dataset整合了纽约市机动车碰撞数据、纽约市每日天气数据和纽约市行政区数据,旨在分析天气条件对碰撞事件的影响,并研究不同行政区的碰撞模式。数据集涵盖了2013年至2023年的碰撞事件,包括碰撞时间、日期、地点、车辆类型、受伤和死亡人数等信息,以及当天的天气状况。数据集支持时间序列分析、地理空间分析、统计相关性研究和机器学习预测模型等任务。

NYC Motor Vehicle Collisions and Weather Dataset整合了纽约市机动车碰撞数据、纽约市每日天气数据和纽约市行政区数据,旨在分析天气条件对碰撞事件的影响,并研究不同行政区的碰撞模式。数据集涵盖了2013年至2023年的碰撞事件,包括碰撞时间、日期、地点、车辆类型、受伤和死亡人数等信息,以及当天的天气状况。数据集支持时间序列分析、地理空间分析、统计相关性研究和机器学习预测模型等任务。
提供机构:
xx103
原始信息汇总

数据集卡片:纽约市机动车碰撞与天气数据集

数据集描述

数据集概述

纽约市机动车碰撞与天气数据集旨在整合纽约市机动车碰撞数据、纽约市每日天气数据和纽约市行政区数据,形成一个统一的数据集。该数据集包括碰撞日期、碰撞ID、行政区、邮政编码、精确的经纬度坐标等信息,并涵盖了碰撞发生时的天气描述、温度、降水和降水类型等数据。

数据集摘要

该数据集提供了2013年至2023年纽约市警察报告的机动车碰撞的全面概览,包括详细的碰撞时间、日期、碰撞ID、行政区、邮政编码、经纬度坐标等信息。每个条目还包括街道名称、街道类型、受伤或死亡人数,以及涉及车辆的贡献因素和车辆类型。此外,数据集还包括碰撞发生当天的温度、降水、降水类型和天气描述。

支持的任务

  • 时间序列分析: 分析机动车碰撞随时间的变化趋势,包括年度或季节性的事故、伤害和死亡人数的波动。
  • 地理空间分析: 利用经纬度数据绘制碰撞位置图,识别热点区域或高频事故行政区。
  • 统计相关性和因果关系研究: 研究碰撞率与时间、天气条件、交通模式、特定位置(行政区或邮政编码)、车辆类型等因素之间的潜在相关性。
  • 机器学习预测模型: 开发预测模型,预测特定区域或条件下碰撞的可能性,有助于预防措施。

语言

英语

数据集结构

数据实例

json { "crash_date": "2021-12-14", "borough": "BROOKLYN", "zip_code": "11211", "latitude": 40.70918273925781, "longitude": -73.95682525634766, "collision_id": 4486555, "crash_time_period": "15:00-17:59", "contributing_factor_vehicles": ["Passing Too Closely", "Unspecified"], "vehicle_types": ["Sedan", "Tractor Truck Diesel"], "number_of_injuries": 0, "number_of_deaths": 0, "street_name": "BROOKLYN QUEENS EXPRESSWAY", "street_type": "ON STREET", "weather_description": "Clear conditions throughout the day.", "precipitation": 0.0, "precipitation_type": null, "temp_max": 11.9, "temp_min": 6.8 }

数据字段

  • Crash Date[Date]: 碰撞发生日期。
  • Borough[string]: 碰撞发生的行政区。
  • Zip Code[string]: 事件发生的邮政编码。
  • Latitude[float]: 全球坐标系统的纬度坐标。
  • Longitude[float]: 全球坐标系统的经度坐标。
  • Collision ID[integer]: 系统生成的唯一记录代码,碰撞表的主键。
  • Crash Time Period[string]: 将碰撞时间分类为预定义的时间间隔,如0:00-2:59,全天分为8个不同的时间段。
  • Street Name[string]: 碰撞发生的街道名称。
  • Street Type[string]: 街道类型(街道/交叉街道/非街道)。
  • Contributing Factors[string]: 碰撞的贡献因素。
  • Vehicle Types[string]: 碰撞中涉及的车辆类型。
  • Weather Description[string]: 碰撞发生时的天气条件。
  • Number of Injured[integer]: 指定碰撞事件中受伤的人数。
  • Number of Death[integer]: 指定碰撞事件中死亡的人数。
  • Precipitation[float]: 碰撞发生时的降水量(毫米)。
  • Precipitation Type[string]: 降水类型(雨/雪/两者/无)。
  • Maximum Temperature[float]: 碰撞发生时的最高温度(华氏度)。
  • Minimum Temperature[float]: 碰撞发生时的最低温度(华氏度)。

数据集创建

数据集来源

  • 纽约市机动车碰撞数据,由纽约市警察局(NYPD)提供,可在纽约市开放数据平台获取。
  • 纽约市每日天气数据,由Visualcrossing提供,来源于多个可靠的历史天气数据源。
  • 纽约市行政区数据,由纽约市政府提供,可在纽约市开放数据平台获取。

个人和敏感信息

该数据集经过处理,确保不包含涉及碰撞的个人的直接个人信息或敏感信息。虽然数据集提供了碰撞的地理坐标,但不包括姓名、地址或其他可用于识别个人的信息。使用该数据集的用户应遵循道德准则和隐私法律。

数据使用注意事项

数据集的社会影响

该数据集融合了NYPD的碰撞数据、纽约市政府的行政区数据和Visualcrossing的天气数据,为理解天气条件与道路安全之间的相互作用提供了重要资源。其全面的分析潜力使城市规划者和研究人员能够制定减少交通事故的策略,从而提高公共安全。

其他已知限制

  1. 地理数据不完整: 数据集有时缺少关键的地理细节,如邮政编码、地理编码、行政区名称或特定街道类型,这可能影响地理空间分析的准确性。
  2. 未指定的贡献因素: 数据集有时缺乏对碰撞贡献因素的具体说明,这可能影响对事故原因的准确理解。
  3. 天气数据的一般性: 天气数据基于每日记录,可能无法精确反映碰撞发生时的天气条件,这可能导致对天气与碰撞率之间关系的分析存在偏差。

其他信息

贡献

该数据集的创建得益于纽约市开放数据和纽约市警察局(NYPD)提供的碰撞和行政区数据,以及Visual Crossing提供的全面天气数据。对这些组织的贡献表示深深的感谢。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建汇聚了纽约市车辆碰撞数据、日常天气数据以及区域数据,旨在通过整合这三类数据,为研究者提供一个全面分析天气条件与车辆碰撞关系的平台。数据集整合了2013至2023年间纽约市五个区的车辆碰撞信息,以及相应的天气状况,包括碰撞发生时的温度、降水类型和降水量等,为研究提供了丰富的时空维度信息。
特点
本数据集的特点在于其多维度的数据融合,不仅包含了详细的车辆碰撞信息,如碰撞时间、地点、涉及车型、伤亡人数等,还整合了碰撞发生时的天气状况描述,以及温度、降水等量化天气指标。这种数据融合使得研究者在分析交通碰撞事件时,能充分考虑天气因素的作用,为交通事故预防和城市安全规划提供了重要参考。
使用方法
用户在使用该数据集时,可以直接访问数据集中的各个字段,如碰撞日期、发生区域、碰撞ID、伤亡人数等,进行时间序列分析、地理空间分析、统计相关性研究等。同时,数据集也适用于构建机器学习预测模型,以预测特定区域或条件下发生碰撞的可能性,为交通管理和安全策略制定提供数据支持。
背景与挑战
背景概述
NYC Motor Vehicle Collisions and Weather Dataset是由纽约市政府、纽约市警察局以及Visualcrossing公司共同构建的复合型数据集。该数据集的创建始于对城市交通安全与气象条件关系的深入探究,旨在整合纽约市2013至2023年间发生的机动车碰撞数据、每日气象数据以及 borough 数据。通过这样的数据整合,研究者能够对碰撞事件与天气条件之间的关系进行细致分析,进而为城市交通规划与安全策略的制定提供科学依据。该数据集不仅揭示了不同区域(borough)的碰撞模式,也为机器学习预测模型的开发奠定了基础,对于交通安全领域的研究产生了重要影响。
当前挑战
尽管该数据集提供了丰富的信息,但在使用过程中仍面临一些挑战。首先,数据集中部分地理信息的缺失,如zip代码、地理坐标、区域名称或特定街道类型,可能影响地理空间分析的准确性。其次,对于车辆碰撞贡献因素的不明确描述或缺失,可能对深入分析碰撞原因造成障碍。最后,基于每日记录的气象数据可能无法精确反映碰撞发生时的实时天气状况,从而对天气条件与交通事故发生率的关联分析造成偏差。这些挑战要求研究者在分析数据时采取谨慎的态度,并可能需要额外的数据源或方法来弥补这些不足。
常用场景
经典使用场景
在探究城市交通安全与气象条件关系的领域,NYC Motor Vehicle Collisions and Weather Dataset数据集的典型应用场景在于,研究者能够综合碰撞事故数据与天气信息,进行深入的时空分析与模式挖掘。该数据集通过整合纽约市五大区的交通事故、每日天气状况以及区域划分信息,为研究者提供了一个全面分析天气对交通事故影响的多维度视角。
解决学术问题
该数据集有效地解决了交通事故研究中,如何将天气因素与事故发生时间、地点相结合进行综合分析的难题。它为学者们提供了探究天气条件如何影响交通事故发生频率和严重性的可能性,进而为城市交通规划与安全策略的制定提供了科学依据。此外,该数据集还助力于识别交通事故的高发区域,为降低事故率提供了重要的数据支持。
衍生相关工作
基于NYC Motor Vehicle Collisions and Weather Dataset,衍生出了一系列相关研究工作。这些研究不仅包括对交通事故与天气关系的统计分析,还涉及利用机器学习技术预测特定天气条件下的交通事故风险,以及基于地理信息系统(GIS)的交通事故热点图绘制等,进一步拓展了数据集的应用范围和影响力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作