five

cdcr-offenses-data|监狱管理数据集|犯罪记录数据集

收藏
github2024-08-22 更新2024-09-10 收录
监狱管理
犯罪记录
下载链接:
https://github.com/redoio/offenses_data
下载链接
链接失效反馈
资源简介:
加利福尼亚州监狱人口统计数据和通过公共记录法获取的犯罪记录,截至2023年12月。数据由加利福尼亚州矫正和康复部(CDCR)提供,通过加利福尼亚公共记录法(CPRA)获取。数据中应用了隐私相关的排除标准,部分识别号码已进行哈希处理以去识别化。
创建时间:
2024-08-22
原始信息汇总

数据集概述

数据来源

  • 数据来源:加利福尼亚州矫正与康复部(CDCR)管辖下的35个州立监狱。
  • 数据获取方式:通过加利福尼亚公共记录法(CPRA)获取。
  • 数据时间:截至2023年12月。

数据处理

  • 隐私保护:应用了与健康信息、年龄等相关的隐私排除标准。
  • 去识别化:部分识别号码已进行哈希处理以去识别化。

数据独立性

  • 独立性声明:数据和分析完全独立于Three Strikes项目、斯坦福大学和Resentencing Data Initiative。

引用

  • 引用格式

    "Redo.io. cdcr-offenses-data (Version 1.0.0) [Dataset]. https://github.com/redoio/offenses_data"

许可

  • 许可类型:开放数据库许可(ODbL)。
  • 许可链接:http://opendatacommons.org/licenses/odbl/1.0/
  • 数据库内容许可:http://opendatacommons.org/licenses/dbcl/1.0/

联系

  • 联系邮箱:aparna.komarla@gmail.com
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由Redo.io通过加利福尼亚公共记录法(CPRA)获取,涵盖了截至2023年12月加利福尼亚州矫正与康复部(CDCR)管辖下的35个州立监狱中在押人员的相关信息。数据收集过程中,CDCR应用了多项隐私保护措施,如健康信息、年龄等敏感数据的排除,并对CDCR识别号进行了哈希处理,以增强数据的安全性和隐私保护。
特点
该数据集具有高度的隐私保护和安全性,通过哈希处理确保了个人身份的匿名性。数据内容详尽,包括在押人员的种族、主要犯罪信息、犯罪开始和结束日期、判决县、判决类型、总刑期、犯罪类别、最早可能释放日期等关键信息。此外,数据集还区分了当前服刑和先前服刑的记录,提供了全面的犯罪历史视角。
使用方法
用户可通过GitHub或data.world平台访问和下载该数据集。数据集包含多个CSV和Excel文件,分别记录了在押人员的 demographics、current commitments 和 prior commitments 信息。使用时,建议参考数据字典以理解各变量的含义和数据格式。若需引用该数据集,请按照提供的引用格式进行标注。
背景与挑战
背景概述
cdcr-offenses-data数据集由Redo.io于2023年创建,旨在提供加利福尼亚州矫正与康复部门(CDCR)管辖下的35个州立监狱中当前在押人口的详细信息。该数据集通过加利福尼亚公共记录法(CPRA)获取,并经过隐私保护措施处理,如对CDCR识别号进行哈希处理。此数据集的核心研究问题涉及犯罪与矫正系统的运作,特别是对当前在押人员的犯罪历史、刑期和释放日期等信息的全面记录。该数据集的发布对刑事司法研究和政策制定具有重要影响,为相关领域的学者和政策制定者提供了宝贵的数据资源。
当前挑战
cdcr-offenses-data数据集在构建过程中面临多项挑战。首先,数据隐私保护是一个主要问题,涉及对敏感信息的处理和匿名化,以确保在押人员的隐私不被侵犯。其次,数据的准确性和完整性也是一个关键挑战,因为需要确保所有记录的犯罪和刑期信息都准确无误。此外,数据集的更新频率和维护也是一个持续的挑战,以确保数据的时效性和可靠性。最后,数据集的使用和分析需要高度的专业知识,以避免对数据的不当解读和潜在的偏见。
常用场景
经典使用场景
cdcr-offenses-data数据集的经典使用场景主要集中在刑事司法研究和政策分析领域。研究者可以利用该数据集分析加利福尼亚州监狱系统的犯罪模式、刑期分布以及再犯率,从而为刑事司法改革提供数据支持。此外,该数据集还可用于评估不同种族和性别在刑罚执行中的差异,以及这些差异对社会公平性的影响。
解决学术问题
该数据集解决了刑事司法领域中关于犯罪模式、刑期长度和再犯率的学术研究问题。通过分析不同犯罪类型的分布和刑期长度,研究者可以深入理解犯罪行为的动态变化,并为政策制定者提供科学依据。此外,该数据集还为研究种族和性别在刑罚执行中的差异提供了宝贵的数据资源,有助于推动社会公平性的研究。
衍生相关工作
基于cdcr-offenses-data数据集,研究者已开展多项相关工作,包括犯罪模式分析、刑期预测模型构建以及再犯风险评估。这些工作不仅深化了对犯罪行为的理解,还为刑事司法系统的改革提供了科学依据。此外,该数据集还促进了跨学科研究,如社会学、心理学和计算机科学在刑事司法领域的交叉应用,推动了相关领域的学术进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Open Power System Data

Open Power System Data is a free-of-charge data platform dedicated to electricity system researchers. We collect, check, process, document, and publish data that are publicly available but currently inconvenient to use. The project is a service provider to the modeling community: a supplier of a public good. Learn more about its background or just go ahead and explore the data platform.

re3data.org 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

EdNet

圣诞老人收集的各种学生活动的大规模分层数据集,一个配备人工智能辅导系统的多平台自学解决方案。 EdNet 包含 2 年多来收集的 784,309 名学生的 131,441,538 次互动,这是迄今为止向公众发布的 ITS 数据集中最大的。资料来源:EdNet:教育中的大规模分层数据集

OpenDataLab 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录