贷前申请评分模型

北京国际大数据交易所2024-07-03 收录

下载链接：

https://webs.bjidex.com/sys-bsc-home/#/bscConsole/tradingMarket/detail?id=2054

下载链接

链接失效反馈

资源简介：

1.    产品介绍贷前申请评分模型是一款用于为金融机构和借贷公司提供高效、准确的贷款申请人评分服务的数据模型，该算法模型使用评分卡(A)标准、python语言和pandas数据分析技术以及算法来对借款人的信用进行评分，为金融机构减少交易中存在的风险。2.    产品优势（1）提高自动化审批效率（2）降低交易风险（3）提高信用评分规范性（4）提高贷款过程合规性3.    产品功能（1）数据整合，对用户的金融信息进行统计和整合（2）评分模型，通过收集申请人信息，自动给出评分（3）综合评分，根据用户上传的数据进行综合评分（4）评分报告，可以自动给出较为详细的评估报告（5）合规与安全防护，提供安全和合规性防护（6）系统集成，可以对接一些金融机构的信贷系统功能描述详细说明数据整合能够自动收集和整合借款人的多维度信息，用于评分服务1. 支持各种信息类型，如交易行为、日常消费、存款信息、投资理财、逾期信息等 2.有独特的算法来统计和分析这些对应的数据评分模型根据收集的资料自动给出评分能够基于机器学习模型计算出借款人的信用评分，该评分能够反映借款人偿还贷款的可能性，为金融机构提供贷款决策依据。综合评分根据用户上传的数据进行综合评分结合自动评分结果，通过分析用户自主上传的信息，进行更为精准的综合评分，以此来评估借款人偿还贷款的可能性，为金融机构提供贷款决策依据。评分报告根据生成结果来输出一个较为详细的报告1. 提供用户评分结果报告 2. 提供相应的风险评估报告 3. 给出相应的措施和建议合规与安全防护提供安全和合规性防护遵循国内外数据保护法规，实施严格的数据脱敏、加密等措施，确保个人信息安全。对系统的所有操作进行记录并生成日志，确保评分决策的可追溯性，符合监管要求。系统集成系统可对接一些金融机构的信贷系统可以接入一些著名的金融结构的信贷系统，使得系统变得更加智能化和自动化。产品功能列表4.    产品组成4.1  准入规则模型贷前准入规则模型是指在正式进入信用评分过程之前，金融机构或贷款平台设定的一系列标准和条件，用于快速筛选出符合基本贷款要求的申请者，并剔除明显不符合条件或存在显著风险的申请。它可以减低交易以及提高审批效率，能够使资源流入合格的申请人手中。序号规则准入准出拒绝理由1年龄≥18且≤60<18或＞60年龄不符合准入规则2是否触发行内黑名单否是触发行内黑名单3是否触发行内关系人名单否是触发行内关系人名单4近1个月贷款或信用卡审批次数≤2＞2近1个月贷款或信用卡审批次数不符合准入规则5近1个月担保资格审批次数≤2＞2近1个月担保资格审批次数不符合准入规则6当前贷款逾期期数≤0＞0当前贷款逾期期数不符合准入规则7当前贷记卡逾期期数≤0＞0贷记卡逾期期数不符合准入规则8当前贷款逾期金额≤0＞0当前贷记卡逾期期数不符合准入规则9当前贷记卡逾期金额≤0＞0当前贷记卡逾期金额不符合准入规则                                       贷前准入规则模型-示意图 01① 基本资格要求：确定一系列基本资格要求，如年龄限制、居住地要求、收入情况和欠款情况等，以筛选符合贷款条件的申请人。② 身份验证：通过人脸识别、指纹识别等技术对申请人提供的证件进行验证，确保证件真实有效，加强身份验证的准确性和可靠性。③ 稳定性评估：对申请人的就业和家庭情况进行考察，评估其资金稳定性，以降低交易风险，确保借款人具备稳定的还款能力。④ 合规性审查：进行合规性审查，确保贷款申请符合相关法律法规及内部政策要求，如确认贷款用途合法性，避免涉及洗钱、恐怖融资等非法活动。4.2 数据输入模块数据输入模块是产品的基础，它包含了构建评分模型所需的各类数据源，是评分模型的重要依据，数据项及其要求包括：序号分类衍生变量加工逻辑1个人基本信息性别身份证号倒数第二位衍生，奇数为男性，偶数为女性2申请年龄根据身份证号衍生（周岁）3征信解读分来自央行征信上的征信解读分数4信用卡信息各行平均授信额度获取贷记卡各行授信额度，将以上额度加总求和，再除以银行数5近六个月平均使用比率各行平均值首先计算贷记卡各行近六个月平均使用比率，贷记卡各行近六个月平均使用比率=贷记卡各行近六个月平均使用额度/各行授信额度，将以上比率加总求和，再除以银行数6本月应还款比率各行平均值首先计算贷记卡各行本月应还款比率，贷记卡各行本月应还款比率=贷记卡各行本月应还款/各行授信额度，将以上比率加总求和，再除以银行数7已用比率各卡最大值计算贷记卡各卡当前已用比率，贷记卡各卡当前已用比率=贷记卡各卡当前已使用额度/各卡授信额度，取其中最大的数值8贷款信息汇总未结清贷款总笔数未结清贷款笔数求和9未结清贷款平均贷款余额未结清贷款本金总余额/未结清贷款总笔数10未结清贷款最近6个月平均应还额未结清贷款最近6个月应还额求平均11征信查询信息近1个月贷款或信用卡审批次数近1个月贷款或信用卡审批次数① 个人基本信息：包括个人的身份信息、职业、教育程度等基本背景资料。② 交易行为：记录个人的交易记录和支付行为，评估其资金流动情况和支付能力。③ 日常消费：追踪个人的日常消费习惯和支出模式，分析其消费稳定性和生活水平。④ 存款信息：收集个人的存款账户信息和存款金额，评估其储蓄能力和财务稳定性。⑤ 投资理财：记录个人的投资活动和理财行为，分析其财务规划和风险承受能力。⑥ 逾期信息：监测个人的信用逾期情况和还款记录，评估其信用风险和偿债能力。4.3 特征工程模块特征工程和数据整合模块负责对输入的数据进行分类、清洗和融合，预处理数据以去除无效、重复或错误数据，并填补缺失值，进行一致性校验以确保数据质量，还将来自不同维度的数据进行关联和合并，以构建出完整的用户档案。技术描述数据清洗清除重复、无效或错误的数据，填补缺失值，处理异常值。特征选择从原始数据中选择最相关的特征，以提高模型性能和降低过拟合的风险。特征变换对原始特征进行变换，如对数变换、标准化、归一化等，以改善数据分布的偏态或缩放范围。特征构建基于原始特征创建新的特征，例如从时间戳中提取年、月、日等信息，或者进行多项式特征扩展。维度约简使用降维技术如主成分分析（PCA）或线性判别分析（LDA）来减少特征维度，以降低计算复杂度或减少冗余信息。特征编码将分类特征转换为数值特征，如独热编码（One-Hot Encoding）、标签编码（Label Encoding）等。特征缩放将特征值缩放到相似的范围，以避免某些特征对模型产生过大的影响，常用的方法包括最小-最大缩放、Z-score标准化等。文本处理对文本数据进行分词、词频统计、TF-IDF转换等处理，将文本数据转换为可用于建模的数值特征。时间序列特征工程对时间序列数据进行滑动窗口统计、时序差分、滞后特征等处理，以提取时间序列数据的相关特征。特征交叉对不同特征进行组合生成新的特征，以提高模型的表达能力和泛化能力，例如使用特征的乘积、加和等进行交叉特征构建。特征选择（基于模型）使用基于模型的特征选择方法，如基于树模型的特征重要性、基于线性模型的特征系数等，来选择最相关的特征。4.4贷前申请评分模型贷前申请评分模型，又称申请评分卡（A卡），是一种利用历史贷款数据和统计学原理量化评估申请人信用风险的模型。通过赋予申请人各项特征权重，并对这些特征进行加权求和或更复杂的数学运算，生成代表申请人信用风险水平的得分，得分通常在特定范围内，高得分表明申请人偿还贷款可能性较高，风险较低。这种评分用于判断是否发放贷款。4.4.1  评分模块训练使用Python中的pandas-ml、WOE、scorecardpy、scikit-learn、XGBoost、LightGBM等库来训练评分模型，机器学习算法包括，逻辑回归、神经网络、随机森林等，基于这些历史数据来学习信用与各特征之间的关系，生成准确的评分模型。通过交叉验证、网格搜索等方法调整模型参数，提高模型的评分性能。贷前申请评分模型示例序号分类衍生变量加工逻辑分组分数最小值1个人基本信息性别身份证号倒数第二位衍生，奇数为男性，偶数为女性女5046男462申请年龄根据身份证号衍生（周岁）[18,22]4444(22,27]46(27,30]50(30,40]61(40,60]443征信解读分来自央行征信上的征信解读分数缺失4646[0,805)46[805,825)47[825,843)48[843,906)49[906,inf)504信用卡信息各行平均授信额度获取贷记卡各行授信额度，将以上额度加总求和，再除以银行数缺失4141[0,10000)41[10000,15000)46[15000,inf)495近六个月平均使用比率各行平均值首先计算贷记卡各行近六个月平均使用比率，贷记卡各行近六个月平均使用比率=贷记卡各行近六个月平均使用额度/各行授信额度，将以上比率加总求和，再除以银行数缺失4141[0,0.15)53[0.15,0.6)49[0.6,0.9)45[0.9,inf)416本月应还款比率各行平均值首先计算贷记卡各行本月应还款比率，贷记卡各行本月应还款比率=贷记卡各行本月应还款/各行授信额度，将以上比率加总求和，再除以银行数缺失3838[0,0.0166)56[0.0166,0.1)48[0.1,0.134)42[0.134,inf)387已用比率各卡最大值计算贷记卡各卡当前已用比率，贷记卡各卡当前已用比率=贷记卡各卡当前已使用额度/各卡授信额度，取其中最大的数值缺失4040[0,0.085)56[0.085,1)50[1,inf)408贷款信息汇总未结清贷款总笔数未结清贷款笔数求和缺失2828046[1,2]60[3,8]50＞8289未结清贷款平均贷款余额未结清贷款本金总余额/未结清贷款总笔数缺失35350351-100003910001-500004350001-10000050100001-30000051300001-100000050＞10000004810未结清贷款最近6个月平均应还额未结清贷款最近6个月应还额求平均缺失33330451-100005410001-500005050001-10000045100001-30000040300001-100000036＞10000003311征信查询信息近1个月贷款或信用卡审批次数近1个月贷款或信用卡审批次数缺失50500601月2日504.4.2  ks曲线评估模型KS曲线：评估模型区分好坏样本的能力。KS曲线（Kolmogorov-Smirnov Curve）是评估模型区分好坏样本能力的重要工具，其值反映了模型将好坏样本正确分类的可能性。KS值越高，说明模型的区分能力越强。(1) KS值的评估标准: KS值 < 0.20: 表明模型的区分能力较弱，不建议采用。KS值 > 0.75: 可能存在模型过拟合或数据质量问题，需要进一步分析。KS值在 0.20 到 0.75 之间: 一般认为模型具有较好的区分能力。(2) KS曲线在模型评估中的应用:模型稳定性评估: 通过长期的KS验证，可以评估模型的稳定性。如果模型在验证集上的KS值与训练集上的KS值出现大幅度下降（例如下降幅度超过10%），则说明模型可能存在衰退问题，需要重新训练或调整。模型对比评估: 比较不同模型的KS曲线，可以直观地看出哪个模型具有更好的区分能力。模型调优: 在模型调优过程中，可以监控KS曲线的变化，选择使KS值最大的模型参数。分数区间坏客户数好客户数总样本数坏客户率好客户率累积坏客户率累积好客户率KS值[578,+)02002000.00%100.00%0.00%100.00%100.00%[556,578)01001000.00%100.00%0.00%100.00%100.00%[534,556)080800.00%100.00%0.00%100.00%100.00%[512,534)060600.00%100.00%0.00%100.00%100.00%[490,512)20406033.30%66.70%33.30%33.30%0.00%[468,490)30306050.00%50.00%83.30%16.70%66.60%(-,468)40206066.70%33.30%100.00%0.00%100.00%(1) 结合表格数据:根据您提供的表格数据，我们可以计算每个分数区间的KS值，并绘制KS曲线。通过分析KS曲线，我们可以评估模型的区分能力以及是否存在模型衰退等问题。例如：假设训练集上的KS值为0.50，4个月后验证集上的KS值为0.45，下降幅度为10%。这表明模型可能存在衰退问题，需要进一步分析。结论:KS曲线是评估模型区分好坏样本能力的重要工具，在模型评估和调优中发挥着重要作用。通过分析KS曲线，我们可以更好地了解模型的性能，并采取措施提高模型的鲁棒性和稳定性。4.4.3 评分展示模块汇总信用评分、决策结果、关键影响因素等信息，生成详细的信用评估报告。以图表、仪表盘等形式直观展示评分分布、风险等级划分等统计信息，供金融机构以及借贷公司对借款人进行分析与监控。序号7分组等级分数分组策略风险等级11[578,+)通过低风险22[556,578)通过中风险33[534,556)通过44[512,534)通过55[490,512)拒绝高风险66[468,490)拒绝77(-,468)拒绝5.   应用场景贷前申请评分模型产品可广泛应用于以下场景：个人消费贷款审批小微企业融资银行信用卡发卡6.    收费说明贷前申请评分模型产品采用订阅制收费方式，根据用户订阅的功能收取不同费用。用户还可以在使用过程中根据自己的使用情况来订购相应的功能模块，可以灵活的来使用系统给定的功能模块。收费方式，面议。7.   产品交付贷前申请评分算法模型产品使用文档一次性模型产品交付，6个月产品售后服务。

提供机构：

青岛上合世世云科技有限公司

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集