five

Loan Data from Prosper|个人贷款数据集|P2P借贷数据集

收藏
github2022-11-26 更新2024-05-31 收录
个人贷款
P2P借贷
下载链接:
https://github.com/Mahmoud-yassen/Loan-Data-From-Prosper
下载链接
链接失效反馈
资源简介:
Prosper是一个提供个人贷款的P2P借贷平台,该数据集包含113,937条观察记录和81个变量,包括贷款状态、借款人APR、借款人利率、期限等。分析中特别关注2009年7月之后的数据,因为某些关键分析特征在此之前不存在,处理后的数据集包含83,161条观察记录和9个变量。

Prosper is a peer-to-peer (P2P) lending platform that offers personal loans. The dataset comprises 113,937 observations and 81 variables, including loan status, borrower APR, borrower rate, term, and more. The analysis particularly focuses on data from July 2009 onwards, as certain key analytical features were not available prior to this date. The processed dataset contains 83,161 observations and 9 variables.
创建时间:
2022-11-26
原始信息汇总

数据集概述

数据集名称

  • Loan Data From Prosper

数据集描述

  • 包含数据:113,937条观测,81个变量,包括贷款状态、借款人APR、借款人利率、期限等。
  • 筛选后数据:83,161条观测,9个变量,筛选条件为贷款发放日期在2009年7月之后。

数据集分析发现

  • BorrowerAPR趋势:2009至2012年上升,2012至2014年下降。
  • BorrowerAPR与ProsperScore/ProsperRating (Alpha)的关系:高度负相关。
  • BorrowerAPR与就业状态的关系:平均而言,未就业者的BorrowerAPR较高。
  • BorrowerAPR与LoanOriginalAmount的关系:负相关。
  • LoanOriginalAmount与评级/分数的关系:平均而言,评级或分数越高,LoanOriginalAmount越大。

详细分析

  • BorrowerAPR与LoanOriginalAmount的关系

    • 对于ProsperRating (Alpha)从HR到B,两者关系保持负相关,加强了初始观察。
    • 对于ProsperRating (Alpha)为A和AA,两者关系从负相关变为正相关,与初始观察不符。
  • BorrowerAPR与Term的关系

    • 关系保持负相关,但不同Term类别的影响程度不同,三年和五年期限的关系比一年期限更强。
  • BorrowerAPR与ProsperRating (Alpha)的关系

    • 评级越高,APR越低,符合初始观察。
    • 对于评级从HR到C,APR随Term增加而减少;对于评级从B到AA,APR随Term增加而增加。
  • ProsperScore与LoanOriginalAmount的关系

    • 一年期限的贷款中,Score对Loan Amount无显著影响;三年和五年期限的贷款中,Loan Amount随Score增加而增加。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Loan Data from Prosper数据集构建于Prosper平台,该平台是一个为信用良好或中等的借款人提供个人贷款的点对点借贷平台。数据集包含了从2009年7月之后发起的贷款数据,共计83161条记录和9个变量。这些变量包括贷款状态、借款人年利率、借款人利率、贷款期限等关键信息。数据集的构建旨在通过分析这些变量,揭示贷款市场中的利率变化和借款人信用评分之间的关系。
特点
该数据集的特点在于其详细记录了借款人的信用评分(ProsperScore和ProsperRating (Alpha))与贷款利率(BorrowerAPR)之间的复杂关系。数据显示,借款人的信用评分越高,其贷款利率越低,且贷款金额越大。此外,数据集还揭示了贷款期限对利率的影响,长期贷款的利率通常高于短期贷款。这些特点使得该数据集成为研究信用评分与贷款利率关系的宝贵资源。
使用方法
使用Loan Data from Prosper数据集时,研究人员可以通过分析借款人的信用评分、贷款利率和贷款金额之间的关系,来探索信用评分对贷款利率的影响。此外,数据集还可以用于研究不同贷款期限对利率的影响,以及借款人就业状态对贷款利率的影响。通过这些分析,研究人员可以更好地理解贷款市场中的利率定价机制,并为贷款政策的制定提供数据支持。
背景与挑战
背景概述
Loan Data from Prosper数据集由Prosper公司提供,Prosper是一家专注于个人对个人(P2P)借贷的平台,主要为信用评级为良好或优秀的借款人提供贷款服务。该数据集创建于2009年之后,包含了113,937条贷款记录和81个变量,涵盖了贷款状态、借款人年利率(BorrowerAPR)、借款人利率、贷款期限等关键信息。数据集的核心研究问题集中在分析借款人年利率与贷款金额、信用评分、贷款期限等因素之间的关系。通过对这些数据的深入分析,研究人员能够更好地理解P2P借贷市场的动态,并为借款人、投资者以及平台运营者提供有价值的决策支持。该数据集在金融科技和信用风险评估领域具有重要的影响力,为相关研究提供了丰富的数据基础。
当前挑战
Loan Data from Prosper数据集在解决P2P借贷市场中的信用风险评估和利率定价问题时面临多重挑战。首先,借款人年利率(BorrowerAPR)与贷款金额、信用评分等因素之间的关系复杂且非线性,尤其是在高信用评级(如A和AA)的情况下,这种关系可能发生反转,增加了建模和预测的难度。其次,数据集中存在大量变量,如何有效选择和提取关键特征以构建准确的预测模型是一个重要挑战。此外,数据的时间跨度较大,且部分关键特征在2009年之前的数据中缺失,这限制了数据集的完整性和分析深度。最后,数据集中不同贷款期限(如1年、3年和5年)对利率和贷款金额的影响存在显著差异,如何在不同期限下建立统一的模型也是一个亟待解决的问题。
常用场景
经典使用场景
Loan Data from Prosper数据集广泛应用于信用风险评估和贷款定价策略的研究中。通过对借款人的信用评分、借款金额、借款期限等关键变量的分析,研究者能够深入探讨不同信用等级下借款利率的变化规律,以及这些变量如何共同影响借款人的还款能力和贷款风险。
衍生相关工作
基于Loan Data from Prosper数据集,许多经典研究工作得以展开。例如,研究者通过分析不同信用等级下借款利率与借款金额的关系,提出了信用评分与借款利率的非线性关系模型。此外,该数据集还被用于开发机器学习模型,预测借款人的违约风险,为金融机构的风险管理提供了新的工具和方法。
数据集最近研究
最新研究方向
近年来,基于Prosper贷款数据的研究逐渐聚焦于借款利率(BorrowerAPR)与借款人信用评分(ProsperScore)及贷款金额(LoanOriginalAmount)之间的复杂关系。研究表明,借款利率与信用评分呈显著负相关,且贷款金额的增加通常伴随着信用评分的提升。此外,研究还揭示了借款利率在不同信用评级(ProsperRating)和贷款期限(Term)下的动态变化,尤其是高信用评级(A和AA)的借款人在长期贷款中表现出借款利率上升的趋势。这些发现为理解P2P借贷市场的风险定价机制提供了新的视角,并为金融科技领域的信用评估模型优化提供了重要参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

Awesome JSON Datasets

一个精选的无需认证的JSON数据集列表。

github 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录