five

COMPAS Recidivism Risk Score Data|犯罪风险评估数据集|司法决策数据集

收藏
www.propublica.org2024-10-29 收录
犯罪风险评估
司法决策
下载链接:
https://www.propublica.org/article/how-we-analyzed-the-compas-recidivism-algorithm
下载链接
链接失效反馈
资源简介:
该数据集包含了COMPAS(Correctional Offender Management Profiling for Alternative Sanctions)系统生成的再犯风险评分数据。COMPAS是一种用于评估被告再犯风险的工具,数据集包括了被告的人口统计信息、犯罪历史、COMPAS评分等。
提供机构:
www.propublica.org
AI搜集汇总
数据集介绍
main_image_url
构建方式
COMPAS Recidivism Risk Score Data数据集的构建基于ProPublica对COMPAS系统的深入分析。该数据集收集了数千名被告的详细信息,包括年龄、性别、犯罪历史、社会经济状况等,并通过COMPAS算法计算出每位被告的再犯风险评分。数据收集过程严格遵循伦理和法律标准,确保信息的准确性和隐私保护。
使用方法
COMPAS Recidivism Risk Score Data数据集适用于多种研究目的,包括但不限于刑事司法系统的评估、算法公平性分析以及社会政策制定。研究者可以通过分析不同群体的风险评分差异,探讨算法在不同人群中的表现。使用时需注意数据的伦理和法律限制,确保研究过程的透明性和公正性。
背景与挑战
背景概述
COMPAS Recidivism Risk Score Data是由Northpointe公司开发的一个用于评估被告再犯风险的工具。该数据集的核心研究问题是如何通过算法预测被告在未来两年内是否会再次犯罪。自2016年首次公开以来,该数据集在法律和刑事司法领域引起了广泛关注,因其对司法决策的潜在影响而备受争议。主要研究人员和机构包括Northpointe公司及其合作伙伴,他们致力于通过数据驱动的方法提高司法系统的公正性和效率。
当前挑战
COMPAS Recidivism Risk Score Data在构建和应用过程中面临多重挑战。首先,数据集的准确性和公正性受到质疑,特别是在种族和性别偏见方面。其次,如何确保算法在预测再犯风险时的透明性和可解释性是一个重大难题。此外,数据集的更新和维护也是一个持续的挑战,以确保其能够反映最新的法律和社会动态。最后,如何在实际司法决策中平衡算法预测与人类判断,以避免过度依赖技术而忽视个体差异,也是一个亟待解决的问题。
发展历史
创建时间与更新
COMPAS Recidivism Risk Score Data数据集首次公开于2016年,由ProPublica在对其算法公平性进行调查时发布。此后,该数据集经历了多次更新,以反映最新的司法判决和风险评估实践。
重要里程碑
COMPAS Recidivism Risk Score Data的发布标志着算法在司法系统中的应用受到广泛关注。2016年,ProPublica的调查揭示了该数据集在种族平等方面存在的潜在偏见,引发了关于算法公平性和透明度的全球讨论。这一事件促使学术界和法律界对算法决策的伦理问题进行深入研究,推动了相关法规和指南的制定。
当前发展情况
当前,COMPAS Recidivism Risk Score Data已成为研究算法公平性和司法决策的重要资源。学术界利用该数据集进行多维度分析,以评估和改进风险评估模型的准确性和公正性。同时,政策制定者和法律专家也参考该数据集,推动司法系统的透明化和公正性。该数据集的持续使用和研究,对于促进算法伦理和司法公正具有重要意义。
发展历程
  • COMPAS Recidivism Risk Score Data首次由Northpointe公司发布,用于评估被告再次犯罪的风险。
    2012年
  • ProPublica发布了一项调查报告,指出COMPAS评分系统在种族平等方面存在偏见,引发了广泛的公众讨论和学术研究。
    2016年
  • Northpointe公司回应ProPublica的报告,发布了一份技术文档,详细解释了COMPAS评分系统的算法和设计原理。
    2017年
  • 学术界开始对COMPAS数据集进行深入研究,探讨其在司法系统中的应用及其潜在的偏见问题。
    2018年
  • 多个研究团队发布了关于COMPAS评分系统的新研究成果,进一步探讨了其有效性和公平性。
    2020年
常用场景
经典使用场景
在司法领域,COMPAS Recidivism Risk Score Data数据集被广泛用于评估被告再次犯罪的风险。通过分析被告的个人信息、犯罪历史、社会经济状况等多维度数据,该数据集能够生成一个风险评分,帮助法官和法律专家在量刑和假释决策中做出更为客观和科学的判断。
解决学术问题
COMPAS Recidivism Risk Score Data数据集解决了司法决策中的主观性和不一致性问题。通过引入数据驱动的风险评估模型,该数据集为学术界提供了一个研究司法公正性和算法偏见的重要工具。其研究成果不仅推动了法律与数据科学的交叉研究,还为政策制定者提供了科学依据,以优化司法系统的运作。
实际应用
在实际应用中,COMPAS Recidivism Risk Score Data数据集被用于多个司法管辖区,以辅助法官和假释委员会进行决策。通过提供客观的风险评分,该数据集有助于减少人为偏见,提高司法决策的透明度和公正性。此外,它还被用于培训法律专业人员,使其更好地理解和应用数据驱动的决策工具。
数据集最近研究
最新研究方向
在司法领域,COMPAS Recidivism Risk Score Data数据集的最新研究方向主要集中在算法公平性和透明度上。随着人工智能在司法决策中的应用日益广泛,研究者们致力于探讨如何减少算法偏见,确保风险评估工具的公正性。相关研究不仅关注数据集的构建和算法设计,还深入分析了不同族群和社会经济背景下的风险评估结果,以期为司法系统提供更为公正和透明的决策支持。这些研究对于推动司法公正和提升公众对算法决策的信任具有重要意义。
相关研究论文
  • 1
    Machine Bias: There’s Software Used Across the Country to Predict Future Criminals. And it’s Biased Against Blacks.ProPublica · 2016年
  • 2
    Fairness in Criminal Justice Risk Assessments: The State of the ArtUniversity of Pennsylvania · 2017年
  • 3
    The accuracy, fairness, and limits of predicting recidivismUniversity of California, Berkeley · 2018年
  • 4
    Algorithmic Fairness in Recidivism Prediction: A Critical ReviewUniversity of Michigan · 2020年
  • 5
    A Survey on Bias and Fairness in Machine LearningUniversity of California, Berkeley · 2019年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

(주)동구바이오제약 2024년 기업정보 | 직원수, 근무환경, 복리후생 등

(주)동구바이오제약 기업소개 - 업력 : 42년차, 기업형태 : -, 업종 : 완제 의약품 제조업 | (주)동구바이오제약의 직원수, 연봉, 채용, 근무환경, 복리후생, 재무정보 등이 궁금하시다면, 사람인에서 더 많은 정보를 확인해보세요.

www.saramin.co.kr 收录

鸭绿江流域与水系 – 世界地理数据大百科辞条

鸭绿江流域是指鸭绿江干流和支流汇水区,地理位置为39&deg43′57″N-42&deg17′28″N,123&deg35′59″E-128&deg45′50″E。与其接壤的流域分别是辽河流域(东)、松花江流域(北)、图们江流域(北)、大同江流域(西南)等。鸭绿江流域界线在中国境内从长白山天池火山口的南壁起始,向西南经长白山脉、转向西南至千山山脉的北部,再折向南入海;在朝鲜境内,鸭绿江流域从长白山天池南坡启始向东南经过摩天岭山脉,在头流山(2309 m)转向西南方向的赴战岭山脉,在英雄里附近转向西,经狼林山(2184 m)、广城、松源,转向西南方向的狄逾岭山脉,接江南山脉的南部后至鸭绿江河口。鸭绿江流域面积65215.49 km&sup2,其中,中国境内面积32799.22 km&sup2,朝鲜境内面积32416.27 km&sup2。鸭绿江是中(国)朝(鲜)界河,它起源于长白山天池火山口的南壁,向南经惠山(朝)、折向西经临江(中)、再转向西南直向丹东(中)、新义州(朝),最后在东港(中)和多狮里(朝)附近注入黄海的西朝鲜湾。鸭绿江干流长844.98 km,有几条比较大的支流汇入,包括在朝鲜境内的虛川江、長津江、厚州川、慈城江、禿魯江、忠满江和三桥川;在中国境内的浑江、蒲石河、瑗河等。鸭绿江干流沿中朝国界线自东北向西南流经吉林省的长白朝鲜族自治县、临江市、集安市;辽宁省的桓仁满族自治县、宽甸满族自治县、丹东市和东港市;朝鲜的两江道、慈江道和平安北道。鸭绿江流域地处暖温带湿润季风气候区。年降水量800-1200 mm。流域内多山,最高海拔2745 m,河道比降比较大,达到0.0032,其中在中段可达到0.01。丰富的降水补给和较大的河床比降,使得鸭绿江流域成为亚洲单位面积水资源和水利资源最丰富的流域之一。近80年来,流域内先后建造了水丰水库(中、朝)、渭源水库(中、朝)、铁甲水库(中)、太平哨水库(中)、桓仁水库(中)、回龙山水库(中)、满丰湖水库(朝)、版平里水库(朝)、时中湖水库(朝)、狼林湖水库(朝)、长津湖水库(朝)、赴战湖水库(朝)、丰西湖水库等(朝)。数据文件包括鸭绿江干流、鸭绿江水系和鸭绿江流域地理信息系统数据文件组成。数据集以.kmz 和.shp格式存储,数据量43.8 MB(压缩为20.1 MB)。

国家对地观测科学数据中心 收录

GEO (Gene Expression Omnibus)

GEO (Gene Expression Omnibus) is a public functional genomics data repository supporting MIAME-compliant data submissions. There are also tools provided to help users query and download experiments and curated gene expression profiles.

OPEN DATA NETWORK 收录

LUNA16

LUNA16(肺结节分析)数据集是用于肺分割的数据集。它由 1,186 个肺结节组成,在 888 次 CT 扫描中进行了注释。

OpenDataLab 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录