mllab/alfa_bki
收藏数据集概述
Alfa BKI是一个独特的高质量数据集,收集自信用历史局(俄语:бюро кредитных историй/БКИ)的真实数据源。它包含了相应的信用产品和申请人贷款违约的历史记录。
支持的任务和排行榜
该数据集旨在用于训练模型,以预测申请人的贷款违约情况。
数据集结构
数据实例
以下是一个样本的示例:
json { app_id: 0, history: [ [ 0, 1, 18, 9, 2, 3, 16, 10, 11, 3, 3, 0, 2, 11, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 16, 2, 17, 1, 1, 1, 0, 0, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 4, 1, 3, 4, 1, 0, 0 ], [ 0, 2, 18, 9, 14, 14, 12, 12, 0, 3, 3, 0, 2, 11, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 16, 2, 17, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 4, 1, 3, 4, 1, 0, 0 ], [ 0, 3, 18, 9, 4, 8, 1, 11, 11, 0, 5, 0, 2, 8, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 15, 2, 17, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 4, 1, 2, 3, 1, 1, 1 ], [ 0, 4, 4, 1, 9, 12, 16, 7, 12, 2, 3, 0, 2, 4, 6, 16, 5, 4, 8, 0, 1, 1, 1, 1, 16, 2, 17, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 3, 3, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 4, 1, 3, 1, 1, 0, 0 ], [ 0, 5, 5, 12, 15, 2, 11, 12, 10, 2, 3, 0, 2, 4, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 16, 2, 17, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 3, 3, 3, 3, 4, 3, 3, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 4, 1, 3, 4, 1, 0, 0 ], [ 0, 6, 5, 0, 11, 8, 12, 11, 4, 2, 3, 0, 2, 4, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 9, 5, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 3, 4, 3, 3, 3, 4, 1, 2, 3, 1, 0, 1 ], [ 0, 7, 3, 9, 1, 2, 12, 14, 15, 5, 3, 0, 2, 3, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 16, 2, 17, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 3, 3, 3, 4, 3, 3, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 4, 1, 3, 4, 1, 0, 0 ], [ 0, 8, 2, 9, 2, 3, 12, 14, 15, 5, 3, 0, 2, 13, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 16, 2, 17, 1, 1, 1, 0, 0, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 4, 1, 3, 4, 1, 0, 0 ], [ 0, 9, 1, 9, 11, 13, 14, 8, 2, 5, 1, 0, 2, 11, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 1, 2, 17, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 4, 1, 2, 4, 1, 0, 0 ], [ 0, 10, 7, 9, 2, 10, 8, 8, 16, 4, 2, 0, 2, 11, 6, 16, 5, 4, 8, 1, 1, 1, 1, 1, 15, 2, 17, 0, 1, 1, 0, 0, 0, 0, 0, 0, 3, 3, 3, 3, 3, 4, 3, 3, 3, 3, 3, 3, 3, 3, 4, 3, 3, 3, 4, 1, 2, 4, 1, 0, 0 ] ], flag: 0 }
数据字段
id: 申请ID。history: 一个交易数组,其中每个信用产品表示为一个37维数组,数组的每个元素表示以下列表中的相应特征:id: 申请ID。rn: 信用历史中信用产品的序列号。pre_since_opened: 从贷款开立日期到数据收集日期的天数。pre_since_confirmed: 从贷款信息确认日期到数据收集日期的天数。pre_pterm: 从贷款开立日期到贷款关闭日期的计划天数。pre_fterm: 从贷款开立日期到贷款关闭日期的实际天数。pre_till_pclose: 从数据收集日期到贷款关闭日期的计划天数。pre_till_fclose: 从数据收集日期到贷款关闭日期的实际天数。pre_loans_credit_limit: 信用额度。pre_loans_next_pay_summ: 下一个贷款还款金额。pre_loans_outstanding: 剩余未付贷款金额。pre_loans_total_overdue: 当前逾期债务。pre_loans_max_overdue_sum: 最大逾期债务。pre_loans_credit_cost_rate: 贷款的全成本。pre_loans5: 延迟5天以内的次数。pre_loans530: 延迟5到30天的次数。pre_loans3060: 延迟30到60天的次数。pre_loans6090: 延迟60到90天的次数。pre_loans90: 延迟超过90天的次数。is_zero_loans_5: 标志:没有延迟5天以内。is_zero_loans_530: 标志:没有延迟5到30天。is_zero_loans_3060: 标志:没有延迟30到60天。is_zero_loans_6090: 标志:没有延迟60到90天。is_zero_loans90: 标志:没有延迟超过90天。pre_util: 剩余未付贷款金额与信用额度的比率。pre_over2limit: 当前逾期债务与信用额度的比率。pre_maxover2limit: 最大逾期债务与信用额度的比率。is_zero_util: 标志:剩余未付贷款金额与信用额度的比率为0。is_zero_over2limit: 标志:当前逾期债务与信用额度的比率为0。is_zero_maxover2limit: 标志:最大逾期债务与信用额度的比率为0。enc_paym_{0..n}: 过去n个月的每月还款状态。enc_loans_account_holder_type: 对信用的态度类型。enc_loans_credit_status: 贷款状态。enc_loans_account_cur: 贷款货币。enc_loans_credit_type: 贷款类型。pclose_flag: 标志:从贷款开立日期到贷款关闭日期的计划天数未定义。fclose_flag: 标志:从贷款开立日期到贷款关闭日期的实际天数未确定。
flag: 目标,1 – 客户已违约。




