mstz/heloc
收藏Hugging Face2023-04-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mstz/heloc
下载链接
链接失效反馈官方服务:
资源简介:
HELOC数据集来自FICO,每条记录代表一条信用额度,通常是银行提供的房屋净值贷款(房屋当前市场价值与购买价格之间的差额)。数据集中的客户申请的信用额度在$5,000到$150,000之间。主要任务是根据申请人的信用报告信息预测他们是否会在两年内偿还HELOC账户。数据集包含多个特征,如风险估计、首次交易以来的月数、最后一次交易以来的月数等,用于二元分类任务,即预测客户是否会违约。
HELOC数据集来自FICO,每条记录代表一条信用额度,通常是银行提供的房屋净值贷款(房屋当前市场价值与购买价格之间的差额)。数据集中的客户申请的信用额度在$5,000到$150,000之间。主要任务是根据申请人的信用报告信息预测他们是否会在两年内偿还HELOC账户。数据集包含多个特征,如风险估计、首次交易以来的月数、最后一次交易以来的月数等,用于二元分类任务,即预测客户是否会违约。
提供机构:
mstz
原始信息汇总
HELOC 数据集概述
基本信息
- 名称: HELOC
- 来源: FICO
- 类别:
- 语言: 英语
- 标签: heloc, fico, tabular_classification, binary_classification
- 任务类别: tabular-classification
- 大小类别: 10K<n<100K
- 许可证: cc
数据集描述
- 数据内容: 每个条目代表一个由银行提供的基于房屋净值的信用额度,范围在$5,000 - $150,000之间。
- 任务: 使用申请人的信用报告信息预测其是否能在2年内偿还HELOC账户。
配置与任务
- 配置: risk
- 任务: Binary classification
- 描述: 预测客户是否会违约。
数据集特征
| 特征 | 类型 |
|---|---|
estimate_of_risk |
int8 |
months_since_first_trade |
int32 |
months_since_last_trade |
int32 |
average_duration_of_resolution |
int32 |
number_of_satisfactory_trades |
int16 |
nr_trades_insolvent_for_over_60_days |
int16 |
nr_trades_insolvent_for_over_90_days |
int16 |
percentage_of_legal_trades |
int16 |
months_since_last_illegal_trade |
int32 |
maximum_illegal_trades_over_last_year |
int8 |
maximum_illegal_trades |
int16 |
nr_total_trades |
int16 |
nr_trades_initiated_in_last_year |
int16 |
percentage_of_installment_trades |
int16 |
months_since_last_inquiry_not_recent |
int16 |
nr_inquiries_in_last_6_months |
int16 |
nr_inquiries_in_last_6_months_not_recent |
int16 |
net_fraction_of_revolving_burden |
int32 |
net_fraction_of_installment_burden |
int32 |
nr_revolving_trades_with_balance |
int16 |
nr_installment_trades_with_balance |
int16 |
nr_banks_with_high_ratio |
int16 |
percentage_trades_with_balance |
int16 |
搜集汇总
数据集介绍

构建方式
mstz/heloc数据集是由FICO提供的,旨在对客户的信用风险进行评估。该数据集的构建基于信用报告中的信息,包含每位客户的信用使用历史、交易记录以及其他与信用相关的特征。数据集中的每一条记录代表一条信用额度,通常由银行根据客户的房产净值(即房产市场价值与购买价格之差)的一定比例提供。数据集的根本任务是预测客户是否会在两年内偿还其HELOC账户。
特点
mstz/heloc数据集具有以下显著特点:首先,数据集规模适中,包含10K至100K条记录,便于处理和分析。其次,数据集包含丰富的特征,如风险评估、交易历史、债务负担等,这些特征涵盖了客户的信用行为和财务状况。最后,数据集适用于二分类任务,即预测客户是否会违约,为信用风险评估提供了直接的应用场景。
使用方法
使用mstz/heloc数据集非常便捷。用户可以通过HuggingFace的datasets库轻松加载训练和测试数据。具体来说,用户只需调用load_dataset函数并传入数据集名称'mstz/heloc',即可获得训练数据集。该数据集可以直接用于机器学习模型的训练和评估,为信用风险预测提供了强有力的数据支撑。
背景与挑战
背景概述
HELOC数据集源自FICO的机器学习挑战项目,旨在通过信用报告中的申请者信息预测其在两年内是否会偿还房屋权益信用额度(HELOC)账户。该数据集的创建,为金融机构提供了评估信贷风险的量化工具,对于信用评分模型的研究与开发具有深远影响。自推出以来,它已成为金融风险评估领域的一个重要研究资源,推动了该领域内模型的精确性与可解释性的提升。
当前挑战
数据集在解决信贷违约预测问题的同时,面临以下挑战:首先,数据特征的多样性与复杂性对特征工程和模型选择提出了高要求;其次,构建过程中如何确保模型的公平性、透明度及合规性,避免潜在的歧视问题,是当前研究的重要课题。此外,数据集在样本分布、特征稀疏性等方面亦存在一定的不均衡性,这为模型的泛化能力带来了考验。
常用场景
经典使用场景
在金融信用评估领域,HELOC数据集的应用尤为关键。该数据集主要用于训练机器学习模型,以预测客户是否会按时偿还家庭股权信用额度(HELOC)账户。经典的使用场景包括,金融机构利用数据集中的借款人信用报告信息,构建二分类模型,从而判断客户是否会违约。
衍生相关工作
基于HELOC数据集的研究衍生出了一系列相关工作,包括但不限于改进信用评分模型、探索新的特征工程方法以及结合其他数据源增强模型预测能力等。这些研究进一步推动了信用风险评估领域的科学发展和实际应用。
数据集最近研究
最新研究方向
在金融风险评估领域,mstz/heloc数据集以其详尽的信用记录特征,成为研究者和从业者预测个人信贷违约行为的重要资源。近期研究聚焦于通过该数据集深入分析消费者信用行为,运用机器学习模型提高预测精准度,从而辅助银行等金融机构在贷款审批流程中有效识别潜在风险。这些研究不仅推动了对违约概率的准确评估,也助力于制定更为合理的信贷政策,对维护金融市场稳定具有深远影响。
以上内容由遇见数据集搜集并总结生成



