five

Traffic fatality datasets

收藏
github2023-01-28 更新2024-05-31 收录
下载链接:
https://github.com/scrapd/datasets
下载链接
链接失效反馈
官方服务:
资源简介:
德克萨斯州奥斯汀市的交通死亡数据集,包含详细的生成、合并、增强和更新流程。

The traffic fatality dataset of Austin, Texas, includes detailed processes of generation, merging, enhancement, and updating.
创建时间:
2019-03-05
原始信息汇总

数据集概述

数据集名称

  • 名称: Traffic fatality data sets for Austin, TX

数据可用性

  • 存储期限: 数据集在APD网站上公开可访问2年,之后将被归档并不再公开访问。

数据处理流程

  1. 生成原始数据集

    • 数据集文件名格式: fatalities-{year}-raw.json
    • 生成方式: 直接从ScrAPD生成,无人工干预。
  2. 导入/合并外部数据集

    • 外部数据集文档位置: docs 文件夹
    • 示例导入命令: 使用scrapd-importer-fatalities-socrata.py脚本。
  3. 增强数据集

    • 数据集文件名格式: fatalities-{year}-augmented.json
    • 增强方式: 使用scrapd-augmenter-geocoding-geocensus脚本。
  4. 合并结果

    • 生成文件名格式: *-all-*.json
    • 合并命令示例: 使用jq命令合并特定年份的数据集。

数据集增强与修正

  • 手动修正: 通过augmentation-manual-{year}.json文件进行,支持添加额外字段或更新现有字段值。

完整更新

  • 更新触发条件: ScrAPD版本更新,如1.5.0和1.5.1。
  • 更新操作: 使用scrapd-merger.py脚本更新所有相关年份的数据集。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建过程采用了自动化工作流,分为四个主要步骤:首先,通过ScrAPD工具生成原始数据集,每年生成一个独立的`fatalities-{year}-raw.json`文件;其次,导入并合并外部数据集,如Socrata平台的数据;接着,通过地理编码等工具对数据进行增强,生成`fatalities-{year}-augmented.json`文件;最后,将所有年份的数据集合并为`*-all-*.json`文件,确保数据的完整性和可追溯性。
特点
该数据集的特点在于其高度自动化的构建流程和数据的丰富性。通过ScrAPD工具,数据集能够直接从警方报告中提取信息,并结合外部数据进行增强,如地理编码信息。此外,数据集还支持手动修正,允许用户通过`augmentation-manual-{year}.json`文件对数据进行补充或更新。这种设计确保了数据的准确性和灵活性,适用于多种交通死亡事故的分析场景。
使用方法
该数据集的使用方法较为直观,用户可以通过命令行工具对数据进行操作。例如,使用`jq`命令将多个年份的数据集合并为一个整体文件,或通过Python脚本对数据进行增强和修正。数据集以JSON格式存储,便于直接导入到数据分析工具中进行进一步处理。用户还可以根据需求,选择使用原始数据集或增强后的数据集,以满足不同的研究需求。
背景与挑战
背景概述
Traffic fatality datasets 是由美国德克萨斯州奥斯汀市警察局(APD)发布的交通事故死亡数据集,旨在记录和分析该地区的交通事故死亡案例。该数据集由自动化工作流程生成,涵盖了从2013年至2020年的数据,并通过外部数据集的导入、数据增强和手动修正等步骤,确保数据的完整性和准确性。该数据集的核心研究问题在于通过多源数据的整合与增强,提升交通事故死亡案例的分析能力,为交通安全研究提供高质量的数据支持。其影响力不仅限于奥斯汀市,还为其他城市的交通安全研究提供了可借鉴的框架。
当前挑战
该数据集在构建过程中面临多重挑战。首先,数据源的时效性限制了数据的长期可用性,APD仅公开近两年的数据,超过两年的数据则被归档且无法公开访问。其次,数据增强过程中,尽管通过地理编码等技术提升了数据质量,但手动修正的引入增加了数据处理的复杂性,且需确保修正的准确性和一致性。此外,自动化工作流程的维护与更新也带来了技术挑战,特别是在ScrAPD工具版本更新时,需重新生成所有数据集以确保数据质量。这些挑战不仅影响了数据集的构建效率,也对后续的数据分析和应用提出了更高的要求。
常用场景
经典使用场景
在交通安全研究领域,Traffic fatality datasets数据集被广泛应用于分析交通事故的成因和趋势。研究者通过该数据集,能够深入探讨不同年份、不同地区的交通事故数据,从而识别出高风险区域和时段,为交通安全政策的制定提供数据支持。
实际应用
在实际应用中,Traffic fatality datasets数据集被用于城市交通管理系统的优化。通过分析数据集中的事故数据,交通管理部门能够识别出事故高发区域,并采取针对性的措施,如增设交通信号灯、改善道路设计等,从而降低交通事故的发生率。
衍生相关工作
基于Traffic fatality datasets数据集,许多经典研究工作得以展开。例如,研究者利用该数据集开发了交通事故预测模型,通过机器学习算法预测未来可能发生的事故热点。此外,该数据集还被用于评估不同交通政策的效果,为政策制定者提供科学依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作