Lending Club Loan Data|金融贷款数据集|信用评估数据集
收藏Lending Club Case Study 数据集概述
一般信息
Lending Club 是一个专注于为城市客户提供各种贷款的消费者金融市场。该公司面临的关键挑战是管理其贷款审批流程,以最小化因向被视为高风险的申请人发放贷款而导致的财务损失。本研究旨在理解导致贷款违约的驱动因素,并提供可操作的见解。
目标
主要目标是通过以下方式帮助 Lending Club 减少信贷损失:
- 识别强有力的贷款违约指标变量。
- 帮助公司做出明智的决策以减少财务损失。
- 提供改进贷款审批流程的建议。
数据集概览
数据集包含贷款申请人的各种属性和他们的贷款状态。关键列包括:
- loan_amnt: 借款人申请的贷款金额。
- term: 贷款的还款期限(36或60个月)。
- int_rate: 贷款利率。
- annual_inc: 借款人的年收入。
- grade: Lending Club 分配的贷款等级。
- purpose: 贷款目的。
- dti: 债务收入比。
- issue_year: 贷款发放年份。
- home_ownership: 借款人的房屋所有权信息。
- loan_status: 贷款的当前状态(例如,已全额偿还,已注销)。
结论
基于探索性数据分析(EDA),确定了几个关键见解:
- 利率: 利率在13%-17%之间的贷款有更高的违约可能性。根据DTI比率调整利率可以更好地与借款人的还款能力相匹配。
- 低年收入: 年收入低于₹40,000的申请人更有可能违约。提供财务教育或根据收入设定最高贷款金额可以帮助。
- B、C、D等级的风险评估: 这些等级有最高的违约率。建议对这些等级实施更严格的风险评估标准。
- 期限长度: 60个月期限的贷款更容易违约。评估与较长期限贷款相关的风险,并可能限制最长期限可以减少这种风险。
- 债务整合风险: 这是贷款数量和违约数量最高的类别。仔细评估,并可能调整利率或为债务整合贷款提供财务咨询是建议的。
- 高额贷款: ₹15,000或更高的贷款更有可能违约。对较大额贷款请求进行彻底评估,并为高风险申请人设定贷款上限可以减少违约。
- 小企业贷款: 小企业贷款有较高的违约率。Lending Club 应考虑增加更多参数来评估与小企业贷款相关的风险,以改善风险管理。
- 公开的不良记录: 有更多公开不良记录的借款人更有可能申请破产。Lending Club 应实施措施,确保借款人在批准贷款前没有公开不良记录。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Solar Radiation Data
该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。
www.nrel.gov 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录