default of credit card clients|信用风险数据集|金融分析数据集
收藏信用卡客户数据集分析
数据集目的
本实验旨在基于信用卡客户数据集,在安全领域进行初步数据分析,并借助Python中的框架和库。
数据集分析目标
- 探索信用卡客户数据集并计算主要统计指标。
- 构建数据集中现有属性之间的不同依赖关系。
- 使用多种图表类型可视化数据分析结果。
数据集分析问题
我们将尝试回答一组在分析信用卡客户数据时可能相关的问题:
- 所有客户的平均年龄是多少?
- 在整个客户集中,有多少客户在下个月有违约支付的问题?
- 已婚和单身的客户数量是多少?
- 非唯一值的变量百分比是多少?
- 基于完整相关矩阵,哪些值之间存在非常高的依赖关系?
- 我们如何识别客户操作路线图中的新趋势?
- 我们如何定义特征对的大多数数据点紧密集中的边界?
- 在我们的DataFrame中,准备在下个月违约支付的客户占比是多少?
- 吸引的客户中,数值特征的平均值是多少(客户的平均年龄和平均还款状态延迟)?
- 对于典型的下个月准备支付的客户,2005年9月的平均还款状态是什么?
- 2005年9月有多少客户按时支付?
使用的库
python import pandas as pd import matplotlib.pyplot as plt import numpy as np import seaborn as sns
数据集下载
bash !wget https://archive.ics.uci.edu/ml/machine-learning-databases/00350/default%20of%20credit%20card%20clients.xls !mv -f default of credit card clients.xls CreditCard.xls
结果可视化示例

OECD - Education at a Glance
该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。
www.oecd.org 收录
SuMeyYao/ysmpubmedclt
该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。
hugging_face 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录