five

Prosper Dataset

收藏
github2022-12-08 更新2024-05-31 收录
下载链接:
https://github.com/Douglous-Sobei/LoanDatafromProsper
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含约113,937条贷款记录,每条记录包含81个变量,如贷款金额、借款人利率、当前贷款状态、借款人收入等。

This dataset comprises approximately 113,937 loan records, each containing 81 variables such as loan amount, borrower's interest rate, current loan status, borrower's income, and more.
创建时间:
2022-11-01
原始信息汇总

数据集概述

数据集名称

LoanDatafromProsper

数据集描述

该数据集包含约113,937条贷款记录,每条记录包含81个变量,如贷款金额、借款人利率、当前贷款状态、借款人收入等。

关键发现

  • 借款人利率与Prosper评分的关系:发现Prosper评分与借款人利率的相关性不如预期,表明其他信用风险特征可能使用不同的标准来确定其值。
  • 借款人APR与贷款金额的关系:在HR至B的Prosper评级中,借款人APR与贷款金额呈负相关;而在A和AA评级中,这种关系变为正相关。
  • 借款人APR与贷款期限的关系:对于HR-C评级的借款人,APR随着贷款期限的增加而减少;而对于B-AA评级的借款人,APR随着贷款期限的增加而增加。
  • 贷款期限与借款人利率的关系:长期贷款的借款人利率较高,这与通常认为的长期贷款风险较低且有更长时间累积利息的预期相反。

数据展示重点

  • 重点关注影响借款人APR的特征,使用高数据-to-ink比的图表展示。
  • 展示的主要变量包括贷款状态、月收入、Prosper评级,并探讨这些变量对贷款状态和Prosper评级的主要预测因素。

数据集局限性

  • 虽然探索性数据分析可以生动有趣地了解数据,但要最终确定变量间的关系,需要进行统计测试和构建预测模型。
搜集汇总
数据集介绍
main_image_url
构建方式
Prosper数据集构建于Prosper平台的贷款数据,涵盖了113,937笔贷款记录,每笔贷款包含81个变量。这些变量包括贷款金额、借款人利率、当前贷款状态、借款人收入等关键信息。数据集的构建过程依赖于Prosper平台的实时交易数据,确保了数据的实时性和准确性。通过对这些数据的整理和清洗,数据集为研究贷款市场提供了坚实的基础。
特点
Prosper数据集的特点在于其丰富的变量和广泛的覆盖范围。数据集不仅包含了贷款的基本信息,还涵盖了借款人的信用评分、贷款期限、利率等关键指标。特别值得注意的是,数据集中ProsperRating(Alpha)和ProsperScore的引入,为研究贷款风险提供了多维度的视角。此外,数据集中借款人的年利率(APR)与贷款金额、贷款期限之间的关系呈现出复杂的相关性,这为深入分析贷款市场提供了宝贵的数据支持。
使用方法
Prosper数据集的使用方法多样,适用于多种研究场景。研究者可以通过分析数据集中的变量,探索贷款市场中的利率形成机制、贷款风险预测模型等。具体而言,可以通过数据可视化技术,如散点图、箱线图等,展示借款人的年利率与贷款金额、贷款期限之间的关系。此外,还可以利用机器学习算法,构建预测模型,预测贷款的风险等级或借款人的违约概率。数据集的使用不仅限于学术研究,还可为金融机构提供决策支持,优化贷款产品的设计和风险控制策略。
背景与挑战
背景概述
Prosper Dataset是由Prosper Marketplace创建的一个关于贷款数据的公开数据集,涵盖了113,937笔贷款的记录,每笔贷款包含81个变量,如贷款金额、借款人利率、当前贷款状态和借款人收入等。该数据集自2005年Prosper Marketplace成立以来,逐渐成为研究P2P借贷市场的重要资源。其主要研究问题包括贷款风险评估、借款人利率与信用评分的关系,以及贷款期限对利率的影响等。该数据集为金融科技领域的研究提供了丰富的数据支持,特别是在信用评分模型和贷款定价策略的研究中具有重要影响力。
当前挑战
Prosper Dataset在解决贷款风险评估和利率预测等核心问题时面临多重挑战。首先,贷款数据的复杂性和多样性使得变量之间的关系难以直观理解,例如借款人利率与贷款期限的关系在不同信用评分区间表现出不同的相关性。其次,数据集中存在大量缺失值和异常值,这增加了数据清洗和预处理的难度。此外,构建有效的预测模型需要克服变量之间的多重共线性问题,并确保模型的泛化能力。最后,数据集的动态性和市场环境的变化也要求模型具备较强的适应性和更新能力。
常用场景
经典使用场景
Prosper数据集广泛应用于金融科技领域,特别是在个人贷款风险评估和利率预测方面。研究人员通过分析该数据集中的贷款金额、借款人利率、贷款状态等变量,能够深入理解不同信用评级下的借款人行为及其对贷款利率的影响。这一数据集为探索贷款市场的动态提供了丰富的数据支持。
解决学术问题
Prosper数据集解决了金融领域中关于信用评分与贷款利率之间关系的复杂问题。通过分析借款人的信用评级(ProsperRating)与借款利率(BorrowerRate)之间的相关性,研究人员能够揭示不同信用评级下利率变化的规律。此外,该数据集还帮助研究者理解贷款期限对利率的影响,尤其是在不同信用评级群体中的差异性表现。
衍生相关工作
基于Prosper数据集,许多经典研究工作得以展开。例如,研究人员开发了多种机器学习模型,用于预测贷款违约风险和优化利率定价策略。此外,该数据集还催生了一系列关于信用评分与贷款利率关系的学术研究,进一步推动了金融科技领域的发展。这些研究不仅提升了贷款市场的透明度,还为借款人提供了更加公平的贷款条件。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作