cdcr-offenses-data
收藏github2024-08-22 更新2024-09-10 收录
下载链接:
https://github.com/redoio/offenses_data
下载链接
链接失效反馈官方服务:
资源简介:
加利福尼亚州监狱人口统计数据和通过公共记录法获取的犯罪记录,截至2023年12月。数据由加利福尼亚州矫正和康复部(CDCR)提供,通过加利福尼亚公共记录法(CPRA)获取。数据中应用了隐私相关的排除标准,部分识别号码已进行哈希处理以去识别化。
California prison population statistics and criminal records obtained through the Public Records Act, as of December 2023. The data was provided by the California Department of Corrections and Rehabilitation (CDCR) and acquired via the California Public Records Act (CPRA). Privacy-related exclusion criteria were applied to the dataset, and certain identification numbers have been hashed for de-identification purposes.
创建时间:
2024-08-22
原始信息汇总
数据集概述
数据来源
- 数据来源:加利福尼亚州矫正与康复部(CDCR)管辖下的35个州立监狱。
- 数据获取方式:通过加利福尼亚公共记录法(CPRA)获取。
- 数据时间:截至2023年12月。
数据处理
- 隐私保护:应用了与健康信息、年龄等相关的隐私排除标准。
- 去识别化:部分识别号码已进行哈希处理以去识别化。
数据独立性
- 独立性声明:数据和分析完全独立于Three Strikes项目、斯坦福大学和Resentencing Data Initiative。
引用
-
引用格式:
"Redo.io. cdcr-offenses-data (Version 1.0.0) [Dataset]. https://github.com/redoio/offenses_data"
许可
- 许可类型:开放数据库许可(ODbL)。
- 许可链接:http://opendatacommons.org/licenses/odbl/1.0/
- 数据库内容许可:http://opendatacommons.org/licenses/dbcl/1.0/
联系
- 联系邮箱:aparna.komarla@gmail.com
搜集汇总
数据集介绍

构建方式
该数据集由Redo.io通过加利福尼亚公共记录法(CPRA)获取,涵盖了截至2023年12月加利福尼亚州矫正与康复部(CDCR)管辖下的35个州立监狱中在押人员的相关信息。数据收集过程中,CDCR应用了多项隐私保护措施,如健康信息、年龄等敏感数据的排除,并对CDCR识别号进行了哈希处理,以增强数据的安全性和隐私保护。
特点
该数据集具有高度的隐私保护和安全性,通过哈希处理确保了个人身份的匿名性。数据内容详尽,包括在押人员的种族、主要犯罪信息、犯罪开始和结束日期、判决县、判决类型、总刑期、犯罪类别、最早可能释放日期等关键信息。此外,数据集还区分了当前服刑和先前服刑的记录,提供了全面的犯罪历史视角。
使用方法
用户可通过GitHub或data.world平台访问和下载该数据集。数据集包含多个CSV和Excel文件,分别记录了在押人员的 demographics、current commitments 和 prior commitments 信息。使用时,建议参考数据字典以理解各变量的含义和数据格式。若需引用该数据集,请按照提供的引用格式进行标注。
背景与挑战
背景概述
cdcr-offenses-data数据集由Redo.io于2023年创建,旨在提供加利福尼亚州矫正与康复部门(CDCR)管辖下的35个州立监狱中当前在押人口的详细信息。该数据集通过加利福尼亚公共记录法(CPRA)获取,并经过隐私保护措施处理,如对CDCR识别号进行哈希处理。此数据集的核心研究问题涉及犯罪与矫正系统的运作,特别是对当前在押人员的犯罪历史、刑期和释放日期等信息的全面记录。该数据集的发布对刑事司法研究和政策制定具有重要影响,为相关领域的学者和政策制定者提供了宝贵的数据资源。
当前挑战
cdcr-offenses-data数据集在构建过程中面临多项挑战。首先,数据隐私保护是一个主要问题,涉及对敏感信息的处理和匿名化,以确保在押人员的隐私不被侵犯。其次,数据的准确性和完整性也是一个关键挑战,因为需要确保所有记录的犯罪和刑期信息都准确无误。此外,数据集的更新频率和维护也是一个持续的挑战,以确保数据的时效性和可靠性。最后,数据集的使用和分析需要高度的专业知识,以避免对数据的不当解读和潜在的偏见。
常用场景
经典使用场景
cdcr-offenses-data数据集的经典使用场景主要集中在刑事司法研究和政策分析领域。研究者可以利用该数据集分析加利福尼亚州监狱系统的犯罪模式、刑期分布以及再犯率,从而为刑事司法改革提供数据支持。此外,该数据集还可用于评估不同种族和性别在刑罚执行中的差异,以及这些差异对社会公平性的影响。
解决学术问题
该数据集解决了刑事司法领域中关于犯罪模式、刑期长度和再犯率的学术研究问题。通过分析不同犯罪类型的分布和刑期长度,研究者可以深入理解犯罪行为的动态变化,并为政策制定者提供科学依据。此外,该数据集还为研究种族和性别在刑罚执行中的差异提供了宝贵的数据资源,有助于推动社会公平性的研究。
衍生相关工作
基于cdcr-offenses-data数据集,研究者已开展多项相关工作,包括犯罪模式分析、刑期预测模型构建以及再犯风险评估。这些工作不仅深化了对犯罪行为的理解,还为刑事司法系统的改革提供了科学依据。此外,该数据集还促进了跨学科研究,如社会学、心理学和计算机科学在刑事司法领域的交叉应用,推动了相关领域的学术进步。
以上内容由遇见数据集搜集并总结生成



