Andyrasika/banking-marketing
收藏Hugging Face2023-11-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Andyrasika/banking-marketing
下载链接
链接失效反馈官方服务:
资源简介:
该数据集与葡萄牙银行机构的直接营销活动(电话营销)相关,目标是预测客户是否会订阅定期存款。数据集包含两个文件:train.csv和test.csv,分别包含45,211行和4,521行数据,每行数据包含18个特征列。特征包括客户的基本信息(如年龄、职业、婚姻状况、教育水平、是否有违约、平均年余额、是否有住房贷款、是否有个人贷款)、最后一次联系的信息(如联系方式、日期、月份、持续时间)以及其他相关属性(如本次活动的联系次数、上次活动后的天数、上次活动的联系次数、上次活动的结果)。输出变量为是否订阅定期存款(是/否)。
提供机构:
Andyrasika
原始信息汇总
数据集概述
数据集信息
-
特征列表:
age: 年龄,数据类型为int64job: 工作类型,数据类型为stringmarital: 婚姻状态,数据类型为stringeducation: 教育水平,数据类型为stringdefault: 是否有信用违约,数据类型为stringbalance: 平均年余额,数据类型为int64housing: 是否有住房贷款,数据类型为stringloan: 是否有个人贷款,数据类型为stringcontact: 联系沟通类型,数据类型为stringday: 最后联系日的月份日期,数据类型为int64month: 最后联系月的年份月份,数据类型为stringduration: 最后联系持续时间,数据类型为int64campaign: 当前活动中对该客户的联系次数,数据类型为int64pdays: 自上次联系以来的天数,数据类型为int64previous: 之前活动中对该客户的联系次数,数据类型为int64poutcome: 之前营销活动的结果,数据类型为stringy: 客户是否订阅了定期存款,数据类型为string
-
数据分割:
train: 训练集,包含 45211 个样本,大小为 6654353 字节test: 测试集,包含 4521 个样本,大小为 665707 字节
-
数据集大小:
- 下载大小: 834481 字节
- 数据集总大小: 7320060 字节
-
配置:
default配置:- 训练集路径:
data/train-* - 测试集路径:
data/test-*
- 训练集路径:
数据集内容
- 训练集: 包含 45211 行和 18 列,按日期排序(从 2008 年 5 月到 2010 年 11 月)
- 测试集: 包含 4521 行和 18 列,随机从训练集中选取 10% 的样本
列描述
- 客户数据:
age: 年龄(数值型)job: 工作类型(分类型)marital: 婚姻状态(分类型)education: 教育水平(分类型)default: 是否有信用违约(二元型)balance: 平均年余额(数值型)housing: 是否有住房贷款(二元型)loan: 是否有个人贷款(二元型)
- 当前活动的最后联系:
contact: 联系沟通类型(分类型)day: 最后联系日的月份日期(数值型)month: 最后联系月的年份月份(分类型)duration: 最后联系持续时间(数值型)
- 其他属性:
campaign: 当前活动中对该客户的联系次数(数值型)pdays: 自上次联系以来的天数(数值型)previous: 之前活动中对该客户的联系次数(数值型)poutcome: 之前营销活动的结果(分类型)
- 目标变量:
y: 客户是否订阅了定期存款(二元型)



