five

yuvidhepe/us-accidents-updated|交通事故数据集|交通数据分析数据集

收藏
hugging_face2023-05-29 更新2024-03-04 收录
交通事故
交通数据分析
下载链接:
https://hf-mirror.com/datasets/yuvidhepe/us-accidents-updated
下载链接
链接失效反馈
资源简介:
这是一个覆盖美国49个州的全国性交通事故数据集,数据收集自2016年2月至2023年3月,通过多种交通API实时收集。目前数据集中包含约770万条交通事故记录,可用于实时交通事故预测、热点位置研究、伤亡分析以及环境因素对事故发生的影响研究等。
提供机构:
yuvidhepe
原始信息汇总

数据集概述

数据集名称

  • 名称: US Accidents (2016 - 2023)

数据集内容

  • 描述: 这是一个覆盖美国49个州的汽车事故数据集,数据收集自2016年2月至2023年3月,通过多个提供实时交通事件数据的API获取。
  • 数据量: 包含约770万条事故记录。

数据集特征

  • 特征列表:
    • ID (字符串)
    • Source (字符串)
    • Severity (整数)
    • Start_Time (字符串)
    • End_Time (字符串)
    • Start_Lat (浮点数)
    • Start_Lng (浮点数)
    • End_Lat (浮点数)
    • End_Lng (浮点数)
    • Distance(mi) (浮点数)
    • Description (字符串)
    • Street (字符串)
    • City (字符串)
    • County (字符串)
    • State (字符串)
    • Zipcode (字符串)
    • Country (字符串)
    • Timezone (字符串)
    • Airport_Code (字符串)
    • Weather_Timestamp (字符串)
    • Temperature(F) (浮点数)
    • Wind_Chill(F) (浮点数)
    • Humidity(%) (浮点数)
    • Pressure(in) (浮点数)
    • Visibility(mi) (浮点数)
    • Wind_Direction (字符串)
    • Wind_Speed(mph) (浮点数)
    • Precipitation(in) (浮点数)
    • Weather_Condition (字符串)
    • Amenity (布尔值)
    • Bump (布尔值)
    • Crossing (布尔值)
    • Give_Way (布尔值)
    • Junction (布尔值)
    • No_Exit (布尔值)
    • Railway (布尔值)
    • Roundabout (布尔值)
    • Station (布尔值)
    • Stop (布尔值)
    • Traffic_Calming (布尔值)
    • Traffic_Signal (布尔值)
    • Turning_Loop (布尔值)
    • Sunrise_Sunset (字符串)
    • Civil_Twilight (字符串)
    • Nautical_Twilight (字符串)
    • Astronomical_Twilight (字符串)

数据集大小

  • 下载大小: 1088140045字节
  • 数据集大小: 3147354997字节

数据集分割

  • 训练集:
    • 大小: 3147354997字节
    • 记录数: 7728394条

许可证

  • 许可证: cc-by-nc-sa-4.0

数据集用途

  • 用途: 仅供研究使用,适用于实时汽车事故预测、事故热点位置研究、伤亡分析、事故原因与效果规则提取,以及研究降水或其他环境因素对事故发生的影响。

联系信息

  • 联系邮箱: moosavi.3@osu.edu
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过整合多个实时交通事件API,涵盖了美国49个州的交通事故数据,时间跨度从2016年2月至2023年3月。数据来源包括美国及各州交通部门、执法机构、交通摄像头及道路网络中的交通传感器。数据集的构建旨在提供一个全面且实时的交通事故数据库,以支持交通管理和安全研究。
使用方法
用户可以通过访问数据集的Kaggle页面进行下载和使用。数据集适用于多种应用场景,如实时交通事故预测、事故热点分析、伤亡分析及环境因素对事故发生的影响研究。使用时需遵守CC BY-NC-SA 4.0许可协议,确保仅用于非商业、研究或学术目的,并需引用相关文献。
背景与挑战
背景概述
在交通管理和公共安全领域,交通事故数据的收集与分析对于预防事故、优化交通管理策略具有重要意义。'US Accidents (2016 - 2023)'数据集由Sobhan Moosavi等研究人员创建,涵盖了美国49个州的交通事故数据,时间跨度从2016年2月至2023年3月。该数据集通过多个实时交通事件API收集,包括美国和各州交通部门、执法机构、交通摄像头和道路网络中的交通传感器提供的数据。这一数据集的创建旨在为交通事故预测、热点分析、原因与结果规则提取等研究提供支持,同时也为研究COVID-19对交通行为和事故的影响提供了宝贵数据。
当前挑战
尽管'US Accidents (2016 - 2023)'数据集为交通事故研究提供了丰富的信息,但其构建过程中仍面临诸多挑战。首先,数据来源多样,包括不同机构和传感器,数据质量和一致性难以保证。其次,数据量庞大,处理和存储这些数据需要高效的计算资源和技术支持。此外,数据中可能包含的偏见和敏感信息,如地理位置和时间戳,需要在分析时进行谨慎处理,以避免潜在的社会影响和隐私问题。最后,数据集的实时更新要求高,确保数据的时效性和准确性是一个持续的挑战。
常用场景
经典使用场景
在交通管理和安全领域,'yuvidhepe/us-accidents-updated'数据集被广泛用于分析和预测交通事故的发生。通过整合多源实时交通数据,该数据集能够帮助研究人员识别事故高发区域,并探索事故发生与天气、时间、地理位置等因素的关联性。此外,该数据集还可用于开发和验证交通事故预测模型,从而为交通管理部门提供决策支持,提升道路安全水平。
解决学术问题
该数据集解决了交通科学领域中关于交通事故发生机制和影响因素的学术研究问题。通过提供大规模、多维度的交通事故数据,研究人员能够深入探讨事故发生的时空分布规律、事故严重程度与环境因素的关系,以及不同交通管理措施对事故发生率的影响。这些研究成果不仅丰富了交通科学的理论体系,还为实际交通管理提供了科学依据。
实际应用
在实际应用中,'yuvidhepe/us-accidents-updated'数据集被用于开发智能交通系统(ITS),以实时监控和预测交通事故。交通管理部门可以利用这些数据优化交通信号控制、规划紧急救援路线,并制定针对性的交通管理策略。此外,保险公司和汽车制造商也可利用该数据集评估驾驶风险,设计更安全的车辆和驾驶辅助系统,从而减少交通事故的发生。
数据集最近研究
最新研究方向
近年来,基于'yuvidhepe/us-accidents-updated'数据集的研究主要集中在交通事故的预测与分析领域。研究者们利用该数据集中的丰富信息,如地理位置、天气条件和交通状况等,开发了多种预测模型,旨在提高交通事故的预警精度。此外,该数据集还被用于研究交通事故与环境因素之间的关系,特别是在极端天气条件下的交通事故模式。这些研究不仅有助于提升交通安全管理水平,还为政策制定者提供了科学依据,以优化交通基础设施和应急响应策略。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

中国高分辨率高质量PM2.5数据集(2000-2023)

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。

国家青藏高原科学数据中心 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

全国景区数据

  中华人民共和国旅游景区质量等级共分为五级,从高到低依次为AAAAA、AAAA、AAA、AA、A级五级。5A级景区代表着中国的世界级精品旅游风景区等级。  CnOpenData汇总整理了全国31个省份及直辖市的景区信息,涵盖了景区名称、省份、景区级别、地址、经纬度、简介等字段,为相关研究助力!

CnOpenData 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。

arXiv 收录