five

ehong/nypd_complaint_data_historic_ds

收藏
Hugging Face2024-07-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/ehong/nypd_complaint_data_historic_ds
下载链接
链接失效反馈
官方服务:
资源简介:
NYPD警察投诉报告数据集包含了纽约警察局处理的投诉报告的详细信息。数据集的特征包括投诉编号、投诉开始日期和时间、投诉结束日期和时间、地址区域代码、报告日期、关键代码、犯罪描述、警察部门代码、警察部门描述、犯罪完成代码、法律类别代码、行政区名称、发生地点描述、场所类型描述、管辖描述、管辖代码、公园名称、住房发展、住房PSA、X坐标、Y坐标、嫌疑人年龄组、嫌疑人种族、嫌疑人性别、交通区域、纬度、经度、经纬度、巡逻行政区、车站名称、受害者年龄组、受害者种族和受害者性别等。

The NYPD Police Complaint Report dataset, covering crime and law enforcement information, includes detailed features such as complaint number, date and time, address, crime description, law enforcement department information, geographical location, etc. The dataset size is between 1M and 10M, with a download size of 3GB and a dataset size of 8914838.
提供机构:
ehong
原始信息汇总

NYPD Police Complaint Report 数据集概述

基本信息

  • 名称: NYPD Police Complaint Report
  • 语言: 英语
  • 标签: 犯罪, 执法
  • 许可证: odc-by
  • 数据量: 1M<n<10M

数据集特征

  • CMPLNT_NUM: 字符串
  • CMPLNT_FR_DT: 字符串
  • CMPLNT_FR_TM: 字符串
  • CMPLNT_TO_DT: 字符串
  • CMPLNT_TO_TM: 字符串
  • ADDR_PCT_CD: 整数 (int32)
  • RPT_DT: 字符串
  • KY_CD: 整数 (int32)
  • OFNS_DESC: 字符串
  • PD_CD: 整数 (int32)
  • PD_DESC: 字符串
  • CRM_ATPT_CPTD_CD: 字符串
  • LAW_CAT_CD: 字符串
  • BORO_NM: 字符串
  • LOC_OF_OCCUR_DESC: 字符串
  • PREM_TYP_DESC: 字符串
  • JURIS_DESC: 字符串
  • JURISDICTION_CODE: 整数 (int32)
  • PARKS_NM: 字符串
  • HADEVELOPT: 字符串
  • HOUSING_PSA: 字符串
  • X_COORD_CD: 整数 (int32)
  • Y_COORD_CD: 整数 (int32)
  • SUSP_AGE_GROUP: 字符串
  • SUSP_RACE: 字符串
  • SUSP_SEX: 字符串
  • TRANSIT_DISTRICT: 整数 (int32)
  • Latitude: 浮点数 (float32)
  • Longitude: 浮点数 (float32)
  • Lat_Lon: 字符串
  • PATROL_BORO: 字符串
  • STATION_NAME: 字符串
  • VIC_AGE_GROUP: 字符串
  • VIC_RACE: 字符串
  • VIC_SEX: 字符串

数据集大小

  • 下载大小: 3GB
  • 数据集大小: 8914838
搜集汇总
数据集介绍
main_image_url
构建方式
在公共安全与犯罪学研究领域,数据集的构建往往依赖于执法机构的官方记录。NYPD警察投诉报告数据集源自纽约市警察局的公开数据门户,通过系统化采集历年来的投诉报告而形成。其构建过程严格遵循数据治理规范,原始报告经过匿名化处理以保护个人隐私,同时保留了关键的案件属性,如时间、地点、犯罪分类及涉及人员的人口统计学信息。数据条目通过唯一标识符进行索引,确保了每条记录的可追溯性与完整性,为大规模犯罪模式分析提供了结构化基础。
使用方法
利用此数据集进行研究时,通常需先进行数据清洗与预处理,以处理可能的缺失值或异常条目。研究者可借助地理信息系统工具将坐标数据可视化,分析犯罪的空间聚集模式;或运用时间序列方法考察犯罪率的周期性变化。在机器学习应用中,该数据集可用于构建预测模型,例如基于历史数据预测特定区域或时段的犯罪风险。数据分析过程应严格遵守数据使用许可协议,确保分析结论的客观性与科学性,从而为犯罪预防和警务资源配置提供数据驱动的决策支持。
背景与挑战
背景概述
纽约市警察局(NYPD)历史投诉数据集由纽约市政府公开数据计划支持,自2006年起持续收集与发布,旨在记录纽约市范围内的警务投诉事件。该数据集由纽约市警察局与纽约市开放数据团队共同维护,核心研究问题聚焦于通过大规模、细粒度的犯罪投诉记录,分析城市犯罪模式、执法效能及公共安全趋势。其对犯罪学、公共政策及城市计算领域产生深远影响,为研究者提供了实证基础,以探索犯罪时空分布、社会因素关联及警务资源配置优化等关键议题。
当前挑战
该数据集致力于解决城市犯罪分析与预测的复杂问题,其挑战在于处理高维度、异构的时空数据,并需应对犯罪事件分类的模糊性与动态演变特性。构建过程中,数据整合面临多重困难,包括原始记录中的缺失值、不一致的编码标准、时空坐标的校准误差,以及涉及敏感个人信息的匿名化处理与隐私保护平衡。此外,数据规模庞大且持续更新,对存储、清洗与标准化流程提出了高效性与可扩展性的严格要求。
常用场景
经典使用场景
在犯罪学与公共安全研究领域,纽约市警察局投诉历史数据集为学者提供了丰富的时空犯罪记录。该数据集最经典的使用场景在于犯罪模式分析与预测建模,研究人员通过整合时间戳、地理坐标及犯罪类型等字段,能够深入挖掘城市犯罪活动的时空分布规律。例如,利用机器学习算法对历史投诉数据进行训练,可构建犯罪热点预测模型,辅助执法部门优化巡逻策略,提升警务资源分配效率。
解决学术问题
该数据集有效解决了犯罪学研究中长期存在的时空数据粒度不足问题。通过提供精确的经纬度坐标、详细犯罪分类及人口统计变量,学者能够探究社会经济因素与犯罪率的关联性,检验环境犯罪学理论如破窗效应在实际场景中的适用性。其意义在于为定量犯罪分析提供了标准化数据基础,推动了犯罪预测模型从理论框架向实证研究的转型,对公共政策制定产生了深远影响。
实际应用
在实际警务运营中,该数据集支撑了智能警务系统的开发与应用。执法机构可基于历史投诉数据构建犯罪风险地图,实现警力动态部署;城市规划部门则利用犯罪类型与场所关联分析,优化公共空间设计以增强安全性。此外,社区组织通过可视化工具解析本地犯罪趋势,能够开展针对性犯罪预防教育,形成数据驱动的社区安全治理新模式。
数据集最近研究
最新研究方向
在公共安全与犯罪学领域,纽约市警察局历史投诉数据集为犯罪模式分析提供了丰富时空维度。当前研究聚焦于利用机器学习算法,结合地理信息系统,预测犯罪高发区域与时段,以优化警力资源配置。随着社会对执法透明度和公平性关注度提升,该数据集亦被用于分析执法行为中的潜在偏见,探索种族、年龄等人口统计学因素与投诉分布关联性。这些研究不仅推动了智慧警务发展,也为城市治理政策制定提供了数据驱动依据,具有显著社会意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作