mstz/compas|再犯预测数据集|种族偏见数据集
收藏数据集概述
基本信息
- 语言: 英语
- 标签:
- compas
- tabular_classification
- binary_classification
- UCI
- 美观名称: Compas
- 大小分类: 1K<n<10K
- 任务分类: tabular-classification
- 配置:
- encoding
- two-years-recidividity
- two-years-recidividity-no-race
- priors-prediction
- priors-prediction-no-race
- race
- 许可证: cc
配置与任务
配置 | 任务 | 描述 |
---|---|---|
encoding | 编码字典,显示编码特征的原始值。 | |
two-years-recidividity | 二元分类 | 被告是否会成为暴力累犯? |
two-years-recidividity-no-race | 二元分类 | 如上,但移除了race 特征。 |
priors-prediction | 回归 | 被告已犯有多少次前科? |
priors-prediction-no-race | 二元分类 | 如上,但移除了race 特征。 |
race | 多类分类 | 被告的种族是什么? |
特征
特征 | 类型 | 描述 |
---|---|---|
sex |
int64 |
性别 |
age |
int64 |
年龄 |
race |
int64 |
种族 |
number_of_juvenile_fellonies |
int64 |
少年重罪次数 |
decile_score |
int64 |
犯罪评分 |
number_of_juvenile_misdemeanors |
int64 |
少年轻罪次数 |
number_of_other_juvenile_offenses |
int64 |
其他少年犯罪次数 |
number_of_prior_offenses |
int64 |
前科次数 |
days_before_screening_arrest |
int64 |
筛选逮捕前的天数 |
is_recidivous |
int64 |
是否累犯 |
days_in_custody |
int64 |
监禁天数 |
is_violent_recidivous |
int64 |
是否暴力累犯 |
violence_decile_score |
int64 |
暴力犯罪评分 |
two_years_recidivous |
int64 |
两年内是否累犯 |

flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录