nateraw/us-accidents
收藏Hugging Face2022-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nateraw/us-accidents
下载链接
链接失效反馈官方服务:
资源简介:
---
license:
- cc-by-nc-sa-4.0
kaggle_id: sobhanmoosavi/us-accidents
---
# Dataset Card for US Accidents (2016 - 2021)
## Table of Contents
- [Table of Contents](#table-of-contents)
- [Dataset Description](#dataset-description)
- [Dataset Summary](#dataset-summary)
- [Supported Tasks and Leaderboards](#supported-tasks-and-leaderboards)
- [Languages](#languages)
- [Dataset Structure](#dataset-structure)
- [Data Instances](#data-instances)
- [Data Fields](#data-fields)
- [Data Splits](#data-splits)
- [Dataset Creation](#dataset-creation)
- [Curation Rationale](#curation-rationale)
- [Source Data](#source-data)
- [Annotations](#annotations)
- [Personal and Sensitive Information](#personal-and-sensitive-information)
- [Considerations for Using the Data](#considerations-for-using-the-data)
- [Social Impact of Dataset](#social-impact-of-dataset)
- [Discussion of Biases](#discussion-of-biases)
- [Other Known Limitations](#other-known-limitations)
- [Additional Information](#additional-information)
- [Dataset Curators](#dataset-curators)
- [Licensing Information](#licensing-information)
- [Citation Information](#citation-information)
- [Contributions](#contributions)
## Dataset Description
- **Homepage:** https://kaggle.com/datasets/sobhanmoosavi/us-accidents
- **Repository:**
- **Paper:**
- **Leaderboard:**
- **Point of Contact:**
### Dataset Summary
### Description
This is a countrywide car accident dataset, which covers __49 states of the USA__. The accident data are collected from __February 2016 to Dec 2021__, using multiple APIs that provide streaming traffic incident (or event) data. These APIs broadcast traffic data captured by a variety of entities, such as the US and state departments of transportation, law enforcement agencies, traffic cameras, and traffic sensors within the road-networks. Currently, there are about __2.8 million__ accident records in this dataset. Check [here](https://smoosavi.org/datasets/us_accidents) to learn more about this dataset.
### Acknowledgements
Please cite the following papers if you use this dataset:
- Moosavi, Sobhan, Mohammad Hossein Samavatian, Srinivasan Parthasarathy, and Rajiv Ramnath. “[A Countrywide Traffic Accident Dataset](https://arxiv.org/abs/1906.05409).”, 2019.
- Moosavi, Sobhan, Mohammad Hossein Samavatian, Srinivasan Parthasarathy, Radu Teodorescu, and Rajiv Ramnath. ["Accident Risk Prediction based on Heterogeneous Sparse Data: New Dataset and Insights."](https://arxiv.org/abs/1909.09638) In proceedings of the 27th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems, ACM, 2019.
### Content
This dataset has been collected in real-time, using multiple Traffic APIs. Currently, it contains accident data that are collected from February 2016 to Dec 2021 for the Contiguous United States. Check [here](https://smoosavi.org/datasets/us_accidents) to learn more about this dataset.
### Inspiration
US-Accidents can be used for numerous applications such as real-time car accident prediction, studying car accidents hotspot locations, casualty analysis and extracting cause and effect rules to predict car accidents, and studying the impact of precipitation or other environmental stimuli on accident occurrence. The most recent release of the dataset can also be useful to study the impact of COVID-19 on traffic behavior and accidents.
### Usage Policy and Legal Disclaimer
This dataset is being distributed only for __Research__ purposes, under Creative Commons Attribution-Noncommercial-ShareAlike license (CC BY-NC-SA 4.0). By clicking on download button(s) below, you are agreeing to use this data only for non-commercial, research, or academic applications. You may need to cite the above papers if you use this dataset.
### Inquiries or need help?
For any inquiries, contact me at moosavi.3@osu.edu
### Supported Tasks and Leaderboards
[More Information Needed]
### Languages
[More Information Needed]
## Dataset Structure
### Data Instances
[More Information Needed]
### Data Fields
[More Information Needed]
### Data Splits
[More Information Needed]
## Dataset Creation
### Curation Rationale
[More Information Needed]
### Source Data
#### Initial Data Collection and Normalization
[More Information Needed]
#### Who are the source language producers?
[More Information Needed]
### Annotations
#### Annotation process
[More Information Needed]
#### Who are the annotators?
[More Information Needed]
### Personal and Sensitive Information
[More Information Needed]
## Considerations for Using the Data
### Social Impact of Dataset
[More Information Needed]
### Discussion of Biases
[More Information Needed]
### Other Known Limitations
[More Information Needed]
## Additional Information
### Dataset Curators
This dataset was shared by [@sobhanmoosavi](https://kaggle.com/sobhanmoosavi)
### Licensing Information
The license for this dataset is cc-by-nc-sa-4.0
### Citation Information
```bibtex
[More Information Needed]
```
### Contributions
[More Information Needed]
---
许可协议:
- cc-by-nc-sa-4.0
Kaggle数据集ID:sobhanmoosavi/us-accidents
---
# 美国交通事故(2016-2021)数据集卡片
## 目录
- [目录](#table-of-contents)
- [数据集描述](#dataset-description)
- [数据集摘要](#dataset-summary)
- [支持的任务与排行榜](#supported-tasks-and-leaderboards)
- [语言](#languages)
- [数据集结构](#dataset-structure)
- [数据实例](#data-instances)
- [数据字段](#data-fields)
- [数据划分](#data-splits)
- [数据集构建](#dataset-creation)
- [筛选依据](#curation-rationale)
- [源数据](#source-data)
- [标注信息](#annotations)
- [个人与敏感信息](#personal-and-sensitive-information)
- [数据集使用注意事项](#considerations-for-using-the-data)
- [数据集的社会影响](#social-impact-of-dataset)
- [偏差讨论](#discussion-of-biases)
- [其他已知局限性](#other-known-limitations)
- [附加信息](#additional-information)
- [数据集维护者](#dataset-curators)
- [许可信息](#licensing-information)
- [引用信息](#citation-information)
- [贡献](#contributions)
## 数据集描述
- **主页**:https://kaggle.com/datasets/sobhanmoosavi/us-accidents
- **代码仓库**:
- **相关论文**:
- **排行榜**:
- **联系人**:
### 数据集摘要
#### 数据集说明
本数据集为覆盖美国49个州的全国性机动车交通事故数据集。事故数据采集自2016年2月至2021年12月,通过多个提供流式交通事件(或事故)数据的应用程序编程接口(API)获取。这些API广播由多种实体采集的交通数据,包括美国及各州交通运输部门、执法机构、道路网络内的交通摄像头与交通传感器。当前本数据集共包含约280万条事故记录。可访问[此处](https://smoosavi.org/datasets/us_accidents)了解该数据集的更多信息。
#### 致谢声明
若使用本数据集,请引用以下论文:
- Moosavi, Sobhan, Mohammad Hossein Samavatian, Srinivasan Parthasarathy, and Rajiv Ramnath. "[全国性交通事故数据集](https://arxiv.org/abs/1906.05409).", 2019.
- Moosavi, Sobhan, Mohammad Hossein Samavatian, Srinivasan Parthasarathy, Radu Teodorescu, and Rajiv Ramnath. "[基于异构稀疏数据的事故风险预测:全新数据集与研究洞察](https://arxiv.org/abs/1909.09638)." 发表于第27届ACM SIGSPATIAL地理信息系统进展国际会议论文集,ACM,2019年。
#### 数据集内容
本数据集通过多个交通API实时采集,当前包含2016年2月至2021年12月期间美国毗邻地区的事故数据。可访问[此处](https://smoosavi.org/datasets/us_accidents)了解该数据集的更多信息。
#### 应用场景
US-Accidents可应用于多种场景,例如实时机动车事故预测、交通事故热点区域研究、伤亡分析、提取因果规则以预测机动车事故,以及研究降水或其他环境因素对事故发生的影响。本数据集的最新版本还可用于研究新冠疫情对交通行为与交通事故的影响。
#### 使用政策与法律免责声明
本数据集仅以知识共享署名-非商业性使用-相同方式共享4.0许可(CC BY-NC-SA 4.0)进行分发,仅用于研究用途。点击下方下载按钮即表示您同意仅将本数据用于非商业性研究或学术用途。若使用本数据集,可能需要引用上述论文。
#### 咨询与帮助
如有任何疑问,请发送邮件至moosavi.3@osu.edu与我联系。
### 支持的任务与排行榜
[需补充更多信息]
### 语言
[需补充更多信息]
## 数据集结构
### 数据实例
[需补充更多信息]
### 数据字段
[需补充更多信息]
### 数据划分
[需补充更多信息]
## 数据集构建
### 筛选依据
[需补充更多信息]
### 源数据
#### 初始数据采集与标准化
[需补充更多信息]
#### 源语言生产者是谁?
[需补充更多信息]
### 标注信息
#### 标注流程
[需补充更多信息]
#### 标注者是谁?
[需补充更多信息]
### 个人与敏感信息
[需补充更多信息]
## 数据集使用注意事项
### 数据集的社会影响
[需补充更多信息]
### 偏差讨论
[需补充更多信息]
### 其他已知局限性
[需补充更多信息]
## 附加信息
### 数据集维护者
本数据集由[@sobhanmoosavi](https://kaggle.com/sobhanmoosavi)分享。
### 许可信息
本数据集的许可协议为cc-by-nc-sa-4.0
### 引用信息
bibtex
[需补充更多信息]
### 贡献
[需补充更多信息]
提供机构:
nateraw
原始信息汇总
数据集概述
数据集描述
- 数据集名称: US Accidents (2016 - 2021)
- 数据集概要: 这是一个覆盖美国49个州的汽车事故数据集,数据收集自2016年2月至2021年12月,通过多个提供实时交通事件数据的API获取。目前该数据集包含约280万条事故记录。
- 数据内容: 数据集包含2016年2月至2021年12月期间,美国连续地区的实时事故数据,通过多个交通API收集。
数据集结构
- 数据实例: [信息待补充]
- 数据字段: [信息待补充]
- 数据分割: [信息待补充]
数据集创建
- 数据收集理由: [信息待补充]
- 源数据: [信息待补充]
- 注释: [信息待补充]
- 个人和敏感信息: [信息待补充]
使用数据集的考虑
- 数据集的社会影响: [信息待补充]
- 数据集的偏见讨论: [信息待补充]
- 其他已知限制: [信息待补充]
附加信息
- 数据集创建者: 数据集由@sobhanmoosavi分享。
- 许可信息: 数据集的许可为cc-by-nc-sa-4.0。
- 引用信息: [信息待补充]
- 贡献: [信息待补充]
搜集汇总
数据集介绍

构建方式
US Accidents数据集通过多个实时交通API收集了2016年2月至2021年12月期间美国49个州的交通事故数据。这些API整合了来自美国及各州交通部门、执法机构、交通摄像头和道路网络传感器的数据流,确保了数据的广泛覆盖和实时性。数据集的构建过程严格遵循了数据采集和标准化的流程,确保了数据的准确性和一致性。
特点
该数据集包含了约280万条交通事故记录,覆盖了美国大部分地区的交通事故情况。数据集中包含了丰富的地理、时间和环境信息,能够支持多种分析任务,如事故热点分析、事故预测以及环境因素对事故影响的研究。此外,数据集还特别适合研究COVID-19疫情期间的交通行为变化及其对事故率的影响。
使用方法
US Accidents数据集主要用于研究目的,适用于非商业性的学术和研究应用。用户可以通过Kaggle平台访问该数据集,并需遵守CC BY-NC-SA 4.0许可协议。使用该数据集时,建议引用相关的研究论文,以确保学术诚信。数据集可用于开发实时事故预测模型、分析事故热点区域、研究事故原因及其影响等。
背景与挑战
背景概述
US Accidents数据集由Sobhan Moosavi等人于2019年首次发布,涵盖了2016年至2021年间美国49个州的交通事故数据。该数据集通过多个交通API实时收集,旨在为交通事故预测、热点分析、伤亡研究以及环境因素对事故影响的研究提供数据支持。数据集的核心研究问题在于如何利用异构稀疏数据进行交通事故风险预测,并为交通管理和政策制定提供科学依据。该数据集在交通工程、地理信息系统和公共安全领域具有重要影响力,尤其是在COVID-19疫情期间交通行为变化的研究中发挥了关键作用。
当前挑战
US Accidents数据集在解决交通事故预测问题时面临多重挑战。首先,数据来源的异构性和稀疏性增加了数据整合和特征提取的难度,可能导致模型训练的不稳定性。其次,由于数据来自多个API和不同机构,数据质量和一致性难以保证,存在潜在的噪声和偏差。此外,数据集中可能包含敏感信息,如何在保护隐私的同时确保数据的可用性是一个重要问题。在构建过程中,研究人员还需应对实时数据流的处理、大规模数据的存储与计算效率等挑战,这些都对数据集的完整性和实用性提出了更高要求。
常用场景
经典使用场景
US-Accidents数据集广泛应用于交通事故预测与分析领域。通过整合来自美国49个州的实时交通数据,该数据集为研究人员提供了丰富的交通事故记录,涵盖了从2016年2月至2021年12月的时间跨度。经典使用场景包括利用机器学习模型预测交通事故的发生概率,识别事故热点区域,以及分析天气、道路状况等环境因素对事故频率的影响。这些应用不仅帮助交通管理部门优化资源配置,还为制定交通安全政策提供了数据支持。
衍生相关工作
US-Accidents数据集催生了一系列相关研究与应用。例如,基于该数据集的研究工作提出了多种交通事故预测模型,如基于深度学习的时空预测模型和基于图神经网络的区域风险评估模型。此外,该数据集还被用于开发智能交通系统(ITS),通过实时分析事故数据,提供动态交通管理建议。相关研究还探索了天气、节假日等因素对交通事故的影响,为交通政策的制定提供了科学依据。这些衍生工作不仅推动了交通事故研究的发展,也为智能交通技术的进步奠定了基础。
数据集最近研究
最新研究方向
近年来,随着交通数据的积累与分析技术的进步,US-Accidents数据集在交通安全领域的研究中扮演了重要角色。该数据集覆盖了美国49个州,时间跨度从2016年至2021年,包含了约280万起交通事故记录。研究者们利用这一数据集,探索了多种前沿研究方向,包括实时交通事故预测、事故热点区域分析、伤亡情况研究以及环境因素对事故发生率的影响。特别是在COVID-19疫情期间,该数据集还被用于研究交通行为的变化及其对事故模式的影响。这些研究不仅提升了交通安全管理的智能化水平,也为政策制定者提供了科学依据,具有重要的社会意义和应用价值。
以上内容由遇见数据集搜集并总结生成



