xx103/NYC_Motor_Vehicle_Collisions_and_Weather_Dataset
收藏数据集卡片:纽约市机动车碰撞与天气数据集
数据集描述
数据集概述
纽约市机动车碰撞与天气数据集旨在整合纽约市机动车碰撞数据、纽约市每日天气数据和纽约市行政区数据,形成一个统一的数据集。该数据集包括碰撞日期、碰撞ID、行政区、邮政编码、精确的经纬度坐标等信息,并涵盖了碰撞发生时的天气描述、温度、降水和降水类型等数据。
数据集摘要
该数据集提供了2013年至2023年纽约市警察报告的机动车碰撞的全面概览,包括详细的碰撞时间、日期、碰撞ID、行政区、邮政编码、经纬度坐标等信息。每个条目还包括街道名称、街道类型、受伤或死亡人数,以及涉及车辆的贡献因素和车辆类型。此外,数据集还包括碰撞发生当天的温度、降水、降水类型和天气描述。
支持的任务
- 时间序列分析: 分析机动车碰撞随时间的变化趋势,包括年度或季节性的事故、伤害和死亡人数的波动。
- 地理空间分析: 利用经纬度数据绘制碰撞位置图,识别热点区域或高频事故行政区。
- 统计相关性和因果关系研究: 研究碰撞率与时间、天气条件、交通模式、特定位置(行政区或邮政编码)、车辆类型等因素之间的潜在相关性。
- 机器学习预测模型: 开发预测模型,预测特定区域或条件下碰撞的可能性,有助于预防措施。
语言
英语
数据集结构
数据实例
json { "crash_date": "2021-12-14", "borough": "BROOKLYN", "zip_code": "11211", "latitude": 40.70918273925781, "longitude": -73.95682525634766, "collision_id": 4486555, "crash_time_period": "15:00-17:59", "contributing_factor_vehicles": ["Passing Too Closely", "Unspecified"], "vehicle_types": ["Sedan", "Tractor Truck Diesel"], "number_of_injuries": 0, "number_of_deaths": 0, "street_name": "BROOKLYN QUEENS EXPRESSWAY", "street_type": "ON STREET", "weather_description": "Clear conditions throughout the day.", "precipitation": 0.0, "precipitation_type": null, "temp_max": 11.9, "temp_min": 6.8 }
数据字段
Crash Date[Date]: 碰撞发生日期。Borough[string]: 碰撞发生的行政区。Zip Code[string]: 事件发生的邮政编码。Latitude[float]: 全球坐标系统的纬度坐标。Longitude[float]: 全球坐标系统的经度坐标。Collision ID[integer]: 系统生成的唯一记录代码,碰撞表的主键。Crash Time Period[string]: 将碰撞时间分类为预定义的时间间隔,如0:00-2:59,全天分为8个不同的时间段。Street Name[string]: 碰撞发生的街道名称。Street Type[string]: 街道类型(街道/交叉街道/非街道)。Contributing Factors[string]: 碰撞的贡献因素。Vehicle Types[string]: 碰撞中涉及的车辆类型。Weather Description[string]: 碰撞发生时的天气条件。Number of Injured[integer]: 指定碰撞事件中受伤的人数。Number of Death[integer]: 指定碰撞事件中死亡的人数。Precipitation[float]: 碰撞发生时的降水量(毫米)。Precipitation Type[string]: 降水类型(雨/雪/两者/无)。Maximum Temperature[float]: 碰撞发生时的最高温度(华氏度)。Minimum Temperature[float]: 碰撞发生时的最低温度(华氏度)。
数据集创建
数据集来源
- 纽约市机动车碰撞数据,由纽约市警察局(NYPD)提供,可在纽约市开放数据平台获取。
- 纽约市每日天气数据,由Visualcrossing提供,来源于多个可靠的历史天气数据源。
- 纽约市行政区数据,由纽约市政府提供,可在纽约市开放数据平台获取。
个人和敏感信息
该数据集经过处理,确保不包含涉及碰撞的个人的直接个人信息或敏感信息。虽然数据集提供了碰撞的地理坐标,但不包括姓名、地址或其他可用于识别个人的信息。使用该数据集的用户应遵循道德准则和隐私法律。
数据使用注意事项
数据集的社会影响
该数据集融合了NYPD的碰撞数据、纽约市政府的行政区数据和Visualcrossing的天气数据,为理解天气条件与道路安全之间的相互作用提供了重要资源。其全面的分析潜力使城市规划者和研究人员能够制定减少交通事故的策略,从而提高公共安全。
其他已知限制
- 地理数据不完整: 数据集有时缺少关键的地理细节,如邮政编码、地理编码、行政区名称或特定街道类型,这可能影响地理空间分析的准确性。
- 未指定的贡献因素: 数据集有时缺乏对碰撞贡献因素的具体说明,这可能影响对事故原因的准确理解。
- 天气数据的一般性: 天气数据基于每日记录,可能无法精确反映碰撞发生时的天气条件,这可能导致对天气与碰撞率之间关系的分析存在偏差。
其他信息
贡献
该数据集的创建得益于纽约市开放数据和纽约市警察局(NYPD)提供的碰撞和行政区数据,以及Visual Crossing提供的全面天气数据。对这些组织的贡献表示深深的感谢。




