OpenPoliceData
收藏github2024-05-19 更新2024-05-31 收录
下载链接:
https://github.com/openpolicedata/openpolicedata
下载链接
链接失效反馈资源简介:
OpenPoliceData是一个全面的美国警务数据集中访问点,提供超过425个事件级别的数据集,涵盖约4850个警察机构。数据类型包括交通停止、使用武力、警员涉及的枪击事件和投诉等。
OpenPoliceData serves as a comprehensive access point for U.S. policing datasets, offering over 425 incident-level datasets that cover approximately 4,850 police agencies. The data types include traffic stops, use of force, officer-involved shootings, and complaints, among others.
创建时间:
2021-11-08
原始信息汇总
数据集概述
数据集名称
OpenPoliceData (OPD)
数据集描述
OpenPoliceData (OPD) 是一个Python库,提供美国最全面的集中式公共访问点,用于事件级别的警察数据。OPD 提供了对大约 4850 个警察机构的 425+ 事件级别数据集的轻松访问。数据类型包括交通停止、使用武力、涉及警察的枪击事件和投诉。
数据访问方式
用户通过部门名称和数据类型请求数据,数据以 pandas DataFrame 的形式返回。无需手动在线查找数据或了解如何使用开放数据API(如ArcGIS,Socrata等)。
数据集更新
最新添加的数据集包括:
- 路易斯维尔,KY:涉及警察的枪击事件数据
- 诺威奇,CT:涉及警察的枪击事件数据
- 费尔法克斯县,VA:2023年逮捕、交通引证和交通警告
- 阿什维尔,NC:逮捕、引证、投诉、事件、指武器、交通停止、使用武力和2023年服务呼叫
- 萨克拉门托,CA:2024年服务呼叫、2021-2024年事件和2023-2024年引证
- 阿尔伯马尔县,VA:停止
- 诺曼,OK:事故、事件和交通停止数据(新)以及最近的逮捕、投诉和使用武力数据
- 奥克兰,CA:停止
- 华盛顿特区:针对MPD的诉讼
- 布卢明顿,IN:使用武力和引证
数据集版本更新
- v0.7.1 - 2024-06-01
- 添加了涉及警察的枪击事件中标准化的主体和警察名称字段
- 增加了处理Excel文件中存储数据更多格式的能力
- 更改了OPD源表中的年份列位置,使其更明显
- 不推荐使用 iloc 与数据集表,因为年份列位置已更改
贡献指南
欢迎所有贡献,包括代码增强、错误修复、错误报告、文档更新和寻找新数据集。详细指南可参考 Contributing Guide。
AI搜集汇总
数据集介绍

构建方式
OpenPoliceData数据集通过整合美国500多个警察机构的数据,构建了一个全面的警务数据集中平台。该数据集涵盖了交通拦截、使用武力、警察枪击事件及投诉等多种类型的数据。其构建方式依赖于自动化工具,用户通过指定部门名称和数据类型,即可获取相应的数据,无需手动查找或处理复杂的API接口。数据返回格式为pandas DataFrame,确保了数据的原样性和透明性,同时提供了原始数据的链接以供验证。
特点
OpenPoliceData数据集的主要特点在于其全面性和易用性。该数据集包含了美国4865个警察机构的详细事件级数据,覆盖了多种警务活动类型。其自动化加载机制使得用户无需具备API操作知识,仅需两行代码即可获取所需数据。此外,数据集保持了原始数据的完整性,仅在日期字段上进行了标准化处理,确保了数据的真实性和可追溯性。
使用方法
使用OpenPoliceData数据集非常简便,用户只需通过Python包管理器安装该库,并导入相应的模块。随后,用户可以通过指定部门名称和数据类型,调用load方法加载所需数据。数据以pandas DataFrame的形式返回,便于进一步的分析和处理。该数据集还提供了详细的文档和示例代码,帮助用户快速上手并充分利用其丰富的数据资源。
背景与挑战
背景概述
OpenPoliceData(OPD)是一个全面的Python库,旨在为美国提供最广泛的警察事件级数据集中访问点。该数据集由多个研究人员和机构共同创建,涵盖了超过4865个警察机构的数据,包括交通拦截、武力使用、警察枪击事件和投诉等多种类型。OPD的创建旨在简化用户获取这些数据的过程,用户只需通过部门名称和数据类型请求数据,即可获得以pandas DataFrame格式返回的未修改数据。这一数据集的推出,极大地促进了警察行为数据的透明化和公共监督,对推动警务改革和政策制定具有重要意义。
当前挑战
OpenPoliceData在构建过程中面临多项挑战。首先,数据来源多样且格式不统一,涵盖了从ArcGIS到Socrata等多种API,这要求OPD具备强大的兼容性和数据处理能力。其次,数据的质量和一致性问题也是一大挑战,不同机构的数据标准和记录方式差异较大,导致数据整合和分析的复杂性增加。此外,随着数据量的增加,如何高效地存储、检索和更新数据,以及确保数据的安全性和隐私保护,也是OPD需要持续解决的问题。
常用场景
经典使用场景
OpenPoliceData数据集的经典使用场景主要集中在对美国警察部门的数据进行深入分析和研究。通过该数据集,研究者可以轻松获取包括交通拦截、使用武力、警察枪击事件以及投诉等在内的详细数据。这些数据以pandas DataFrame的形式提供,便于用户进行数据清洗、分析和可视化,从而揭示警察行为模式及其潜在的社会影响。
实际应用
在实际应用中,OpenPoliceData数据集被广泛用于执法部门的绩效评估、政策制定以及公众监督。例如,地方政府可以利用该数据集分析警察行为,识别潜在的偏见和不当行为,从而制定更有效的培训和监督机制。此外,非政府组织和媒体也可以利用这些数据进行公众教育,提高执法透明度和公众信任度。
衍生相关工作
OpenPoliceData数据集的发布催生了一系列相关研究和工作,包括对警察行为模式的大规模分析、种族偏见在执法中的影响研究以及执法透明度的提升策略。许多研究者利用该数据集进行跨学科研究,结合社会学、统计学和计算机科学的方法,揭示警察行为与社会因素之间的复杂关系。此外,该数据集还促进了开源工具和平台的开发,进一步推动了数据驱动的执法改革。
以上内容由AI搜集并总结生成



