five

NYPD Arrest Data|执法数据数据集|犯罪统计数据集

收藏
github2023-12-06 更新2024-05-31 收录
执法数据
犯罪统计
下载链接:
https://github.com/mirLakhani/NYDPcrime
下载链接
链接失效反馈
资源简介:
该数据集包含了2023年纽约市五个行政区内所有NYPD逮捕记录,详细记录了逮捕类型、地点以及包括性别、种族和年龄分组在内的人口统计信息。数据集来源自美国Data.gov网站,共有19列和超过17万行数据,涵盖了逮捕日期、犯罪描述、相关法律代码等信息,以及逮捕者的性别、种族和年龄等人口统计数据。

This dataset encompasses all NYPD arrest records within the five boroughs of New York City for the year 2023, detailing the types of arrests, locations, and demographic information including gender, race, and age groups. Sourced from the U.S. Data.gov website, the dataset comprises 19 columns and over 170,000 rows, covering arrest dates, crime descriptions, relevant legal codes, as well as demographic statistics such as the gender, race, and age of those arrested.
创建时间:
2023-12-05
原始信息汇总

数据集概述

数据集名称

MIST 4610 Group Project 2

数据集描述

该数据集包含了纽约市五个行政区当前年份(2023年1月至9月)的所有NYPD逮捕记录。数据集来源于US Data.gov网站,包含19个列和超过170,000行数据。数据集中的维度包括逮捕日期、犯罪描述、相关法律代码等。此外,还包括被逮捕者的性别、种族和年龄组等人口统计信息。

数据集结构

  • 列数:19列
  • 行数:超过170,000行
  • 数据类型:日期、字符串、数值
  • 主要列
    • Arrest_Key: 唯一标识每项逮捕的数值型主键
    • Arrest_Boro: 描述逮捕发生地的字符串类型,标识纽约市的五个行政区
    • Law_Cat_Cd: 描述犯罪级别的字符串类型,分为重罪、轻罪和违例
    • Jurisdiction: 描述逮捕管辖权的数值类型
    • Arrest Precinct: 描述逮捕发生地的警局编号的数值类型
    • Ky code: 描述犯罪描述对应的3位数代码的数值类型
    • Pd Description: 描述犯罪的具体描述的字符串类型
    • Pd Code: 描述犯罪代码的数值类型
    • Latitude and Longitude: 描述逮捕地点的全球坐标的数值类型(十进制)
    • X and Y Coordinate Cd: 描述逮捕地点的纽约州平面坐标系统的数值类型

数据集来源

  • 来源网站:https://catalog.data.gov/dataset/nypd-arrest-data-year-to-date
  • 详细信息链接:https://data.cityofnewyork.us/Public-Safety/NYPD-Arrest-Data-Year-to-Date-/uip8-fykc

数据集应用

数据集用于分析纽约市各行政区的逮捕情况,包括犯罪类型、地点、时间及人口统计特征。通过Tableau等工具进行可视化分析,以支持法律执行和社区安全策略的制定。

AI搜集汇总
数据集介绍
main_image_url
构建方式
NYPD Arrest Data数据集通过美国Data.gov网站获取,涵盖了2023年1月至9月期间纽约市五个行政区的所有逮捕记录。数据集包含19个字段和超过17万行数据,记录了逮捕日期、犯罪描述、法律代码等关键信息。逮捕记录的唯一标识由随机生成的“Arrest_Key”字段表示,作为主键使用。数据集还详细记录了被捕者的性别、种族、年龄组等人口统计信息,并将年龄分为五个类别。此外,数据集还包含了逮捕地点的行政区、经纬度坐标等地理信息,为后续的空间分析提供了基础。
特点
NYPD Arrest Data数据集的特点在于其多维度的信息覆盖,不仅包含了犯罪类型、法律分类等基础信息,还详细记录了被捕者的性别、种族、年龄组等人口统计特征。数据集通过“Arrest_Boro”字段标识了逮捕发生的行政区,并通过经纬度坐标提供了精确的地理位置信息。此外,数据集还通过“Law_Cat_Cd”字段对犯罪级别进行了分类,分为重罪、轻罪和违规三类。这些特点使得该数据集能够支持复杂的犯罪分析和空间分布研究。
使用方法
使用NYPD Arrest Data数据集时,可以通过Tableau等数据可视化工具进行探索性分析。数据集中的“Arrest_Key”字段可作为唯一标识符,用于追踪特定逮捕记录。通过“Arrest_Boro”字段,可以分析不同行政区的犯罪分布情况。结合“Law_Cat_Cd”字段,可以进一步研究不同犯罪级别的分布特征。此外,数据集中的经纬度坐标可用于空间分析,帮助识别犯罪热点区域。对于时间序列分析,可以利用“Arrest_Date”字段研究犯罪趋势随时间的变化。
背景与挑战
背景概述
NYPD Arrest Data数据集由美国数据门户网站Data.gov提供,记录了2023年1月至9月期间纽约市五个行政区的所有逮捕记录。该数据集由MIST 4610课程的学生团队整理和分析,旨在通过数据揭示纽约市的犯罪模式与社会问题。数据集包含19个字段,涵盖逮捕日期、犯罪描述、法律代码、被捕者的人口统计信息(如性别、种族、年龄组)以及地理位置信息。该数据集的核心研究问题在于通过分析逮捕数据,揭示不同行政区、年龄组和种族群体之间的犯罪分布差异,进而为执法部门提供资源分配和社区干预的依据。该数据集对犯罪学、社会学以及公共政策研究领域具有重要影响,尤其是在犯罪热点识别和社会公平性讨论方面。
当前挑战
NYPD Arrest Data数据集在应用过程中面临多重挑战。首先,数据集所解决的领域问题涉及犯罪行为的时空分布与人口统计特征分析,这要求数据具有高度的准确性和完整性。然而,数据集中可能存在缺失值、重复记录或格式不一致等问题,影响分析的可靠性。其次,构建过程中,团队需处理大量数据(超过17万行),并确保数据清洗和标准化过程的严谨性。此外,数据集的时间跨度仅为9个月,未覆盖全年数据,导致对全年犯罪趋势的预测存在不确定性。最后,数据集中的种族和年龄组信息可能引发关于数据偏见和执法公平性的讨论,如何在分析中保持客观性和公正性也是一个重要挑战。
常用场景
经典使用场景
NYPD Arrest Data数据集在犯罪学和公共安全领域具有广泛的应用,尤其是在分析纽约市五个行政区的犯罪模式和趋势方面。通过该数据集,研究人员能够深入探讨不同行政区、年龄组和种族群体中的犯罪分布情况,进而揭示犯罪热点区域和特定人群的犯罪倾向。这种分析不仅有助于理解犯罪行为的空间和时间分布,还为制定针对性的执法策略提供了数据支持。
解决学术问题
该数据集为犯罪学、社会学和公共政策研究提供了重要的实证基础。通过分析逮捕记录中的时间、地点、犯罪类型和人口统计信息,研究人员能够探讨犯罪行为的驱动因素、执法资源的分配效率以及社会不平等对犯罪率的影响。例如,数据集中的种族和年龄信息为研究执法中的潜在偏见提供了数据支持,推动了关于司法公平性的学术讨论。
衍生相关工作
基于NYPD Arrest Data数据集,许多经典研究工作得以展开。例如,一些研究利用该数据集分析了纽约市犯罪率与社会经济因素之间的关系,揭示了贫困率、教育水平和犯罪率之间的相关性。此外,该数据集还被用于开发犯罪预测模型,通过机器学习算法预测未来的犯罪热点区域,为执法部门提供前瞻性的决策支持。这些衍生研究不仅丰富了犯罪学领域的理论框架,还为实际执法工作提供了科学依据。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录

MIT Indoor Scenes

室内场景识别是高水平视觉中一个具有挑战性的开放性问题。大多数适用于室外场景的场景识别模型在室内领域的表现都较差。该数据库包含67个室内类别,共15620张图像。图像的数量因类别而异,但每个类别至少有100张图像。所有图像均为jpg格式。此处提供的图像仅用于研究目的。

阿里云天池 收录