Bank-Marketing-Dataset-UCI
收藏github2018-07-08 更新2024-05-31 收录
下载链接:
https://github.com/hmehta92/Bank-Marketing-Dataset-UCI-
下载链接
链接失效反馈官方服务:
资源简介:
该数据集与葡萄牙一家银行机构的直接营销活动相关,主要基于电话营销。数据集的分类目标是预测客户是否会订阅定期存款。数据集包含了客户的个人信息、营销活动相关信息以及社会经济背景信息。
This dataset pertains to a direct marketing campaign conducted by a Portuguese banking institution, primarily through telemarketing. The classification objective of the dataset is to predict whether a client will subscribe to a term deposit. The dataset encompasses personal information of clients, details related to the marketing campaign, as well as socio-economic background information.
创建时间:
2018-06-19
原始信息汇总
数据集概述
数据集名称
Bank-Marketing-Dataset-UCI
数据集描述
本数据集与葡萄牙一家银行机构的直接营销活动相关,主要基于电话营销。目标是通过多次接触客户来预测客户是否会订阅银行定期存款。
分类目标
预测客户是否会订阅定期存款(变量 y)。
属性信息
输入变量
- 年龄 (数值型)
- 职业 (分类型: admin.,blue-collar,entrepreneur,housemaid,management,retired,self-employed,services,student,technician,unemployed,unknown)
- 婚姻状况 (分类型: divorced,married,single,unknown)
- 教育程度 (分类型: basic.4y,basic.6y,basic.9y,high.school,illiterate,professional.course,university.degree,unknown)
- 信用违约情况 (分类型: no,yes,unknown)
- 住房贷款情况 (分类型: no,yes,unknown)
- 个人贷款情况 (分类型: no,yes,unknown)
- 联系方式 (分类型: cellular,telephone)
- 最后联系月份 (分类型: jan, feb, mar, ..., nov, dec)
- 最后联系星期 (分类型: mon,tue,wed,thu,fri)
- 最后联系时长 (数值型)
- 本次营销活动中的联系次数 (数值型)
- 自上次联系后的天数 (数值型)
- 之前营销活动的联系次数 (数值型)
- 之前营销活动的结果 (分类型: failure,nonexistent,success)
- 就业变化率 (数值型)
- 消费者价格指数 (数值型)
- 消费者信心指数 (数值型)
- 欧元银行同业拆借利率3个月 (数值型)
- 雇员人数 (数值型)
输出变量
- 是否订阅定期存款 (二元型: yes,no)
搜集汇总
数据集介绍

构建方式
Bank-Marketing-Dataset-UCI数据集的构建是基于葡萄牙一家银行的直销活动记录。该数据集涵盖了通过电话进行的营销活动,其中涉及对同一客户进行多次接触,以判断客户是否会订阅银行定期存款产品。数据集的构建包括了客户的个人信息、最后一次接触的相关信息以及其他社会和经济背景信息,旨在预测客户是否会订阅定期存款产品。
特点
该数据集的特点在于,它提供了详尽的客户个人信息和社会经济背景,包含了客户的职业、婚姻状况、教育水平、信用状况、住房贷款情况以及个人贷款情况等。此外,数据集还记录了最后一次营销活动的通信类型、月份、星期几以及通话时长等。这些特点使得该数据集在预测银行产品订阅行为上具有很高的实用价值。
使用方法
使用Bank-Marketing-Dataset-UCI数据集时,首先需要对数据进行预处理,包括处理缺失值、编码分类变量等。接着,可以利用数据集的特征进行模型训练,如决策树、随机森林、支持向量机等,以预测客户是否会订阅定期存款产品。需要注意的是,通话时长这一特征在现实预测模型中可能需要被排除,因为它在实际电话营销前是未知的。
背景与挑战
背景概述
Bank-Marketing-Dataset-UCI数据集源于葡萄牙某银行机构的直销活动记录。该数据集收集了通过电话进行的营销活动信息,其中经常需要对同一客户进行多次联系,以判断客户是否会订阅银行定期存款产品。此数据集的创建旨在为银行营销策略提供数据支撑,其分类目标是预测客户是否会订阅定期存款产品。该数据集自发布以来,在银行营销、客户关系管理等领域产生了广泛的研究影响。
当前挑战
数据集在研究领域中面临的挑战主要包括:如何准确预测客户订阅行为,考虑到客户数据的多样性和复杂性。构建过程中遇到的挑战涉及如何处理缺失值、分类特征的高基数问题以及如何合理利用时间序列特征,如'contact'、'month'和'day_of_week'等。此外,'duration'特征对输出目标的影响较大,但在实际预测模型中往往需要被排除,以保持模型的现实预测性。
常用场景
经典使用场景
在金融领域,Bank-Marketing-Dataset-UCI数据集被广泛用于研究直接营销活动的效果。该数据集记录了一家葡萄牙银行机构基于电话呼叫的直接营销活动,旨在预测客户是否会订阅定期存款产品。其经典使用场景在于构建分类模型,预测客户对银行产品的订阅意向,即是否将选择订阅定期存款。
衍生相关工作
基于该数据集,研究者们衍生出了一系列相关工作,包括但不限于改进的预测模型、营销策略评估方法以及客户行为分析框架。这些工作进一步扩展了数据集的应用范围,加深了对金融产品营销效果影响因素的理解。
数据集最近研究
最新研究方向
Bank-Marketing-Dataset-UCI数据集关联的直接营销策略分析,近期研究集中于深入挖掘客户特征与营销成功之间的关系。学者们探索了利用机器学习模型预测客户是否会订阅银行定期存款产品,研究方向聚焦于特征选择、模型优化以及社会经济指标对预测结果的影响。这些研究为银行提供了精准营销的理论基础,有助于提升营销效率和客户满意度,同时为金融科技的发展提供了新的视角和数据支持。
以上内容由遇见数据集搜集并总结生成



