Updated-Telecom-CDR-Dataset
收藏github2021-11-27 更新2024-05-31 收录
下载链接:
https://github.com/jamesrawlins1000/Updated-Telecom-CDR-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于对客户进行分类和衡量满意度,包含101174名客户的20个属性,并指示客户是否流失。数据集包括州、账户长度、电话号码、国际计划、邮件计划、语音邮件消息数量、全天分钟数、全天通话次数、全天费用、晚间分钟数、晚间通话次数、晚间费用、夜间分钟数、夜间通话次数、夜间费用、国际分钟数、总收入、短信数量、国际通话次数、国际通话费用和流失客户等变量。
This dataset is utilized for customer classification and satisfaction measurement, encompassing 20 attributes of 101,174 customers, along with an indication of whether the customer has churned. The dataset includes variables such as state, account length, phone number, international plan, voicemail plan, number of voicemail messages, total day minutes, total day calls, total day charge, total evening minutes, total evening calls, total evening charge, total night minutes, total night calls, total night charge, total international minutes, total revenue, number of text messages, total international calls, total international charge, and churned customer status.
创建时间:
2017-05-16
原始信息汇总
Updated-Telecom-CDR-Dataset 概述
数据集内容
- 数据集名称:Updated-Telecom-CDR-Dataset
- 数据集用途:用于客户分类和满意度测量。
- 数据集大小:包含101,174名客户的数据。
- 数据集属性:共有20个属性,包括:
- 州(state)
- 账户长度(account length)
- 电话号码(phone number)
- 国际计划(international plan)
- 邮件计划(mail plan)
- 语音邮件消息数量(number of voice mail messages)
- 总日间分钟数(total day minutes)
- 总日间通话次数(total day calls)
- 总日间费用(total day charge)
- 总晚间分钟数(total evening minutes)
- 总晚间通话次数(total evening calls)
- 总晚间费用(total evening charge)
- 总夜间分钟数(total night minutes)
- 总夜间通话次数(total night calls)
- 总夜间费用(total night charge)
- 总国际分钟数(total international minutes)
- 总收入短信量(total revenue SMS amount)
- 总国际通话次数(total international calls)
- 总国际通话费用(total international calls charge)
- 客户流失情况(churners)
数据集特点
- 包含详细的通话记录信息,如呼叫号码、被叫号码及通话日期和时间。
- 数据集旨在通过分析客户行为和通信模式来评估客户满意度和流失情况。
搜集汇总
数据集介绍

构建方式
Updated-Telecom-CDR-Dataset的构建基于电信行业的呼叫详细记录(CDR),旨在通过分析客户行为来分类客户并衡量其满意度。数据集涵盖了101,174名客户的20个属性,包括客户是否流失的指示。数据的收集涉及多个维度,如通话时长、通话费用、短信使用量等,这些数据通过电信运营商的日常运营自动记录并整理而成。
特点
该数据集的特点在于其全面性和多样性,涵盖了从基本客户信息到详细的通话记录和费用数据。每个客户的数据包括账户长度、国际计划、语音邮件数量、日间和夜间通话时长及费用等。此外,数据集还特别标注了客户流失情况,为研究客户流失预测提供了宝贵的信息。这种多维度的数据组合使得该数据集在电信行业的研究中具有重要的应用价值。
使用方法
使用Updated-Telecom-CDR-Dataset时,研究人员和数据分析师可以通过分析数据集中的多个变量来探索客户行为模式,预测客户流失,并评估不同服务计划对客户满意度的影响。数据集的结构化格式便于进行数据挖掘和机器学习模型的训练,特别是在分类和回归分析中。此外,该数据集也可用于开发客户细分策略,优化营销活动和提升客户服务质量。
背景与挑战
背景概述
Updated-Telecom-CDR-Dataset 是一个专注于电信行业客户行为分析的数据集,旨在通过通话详单记录(CDR)数据对客户进行分类并衡量其满意度。该数据集由101,174名客户的20个属性组成,涵盖了客户的基本信息、通话行为、国际通话计划、语音邮件使用情况等。数据集的核心研究问题在于通过分析这些属性,预测客户流失(churn)的可能性,从而帮助电信公司优化客户服务和制定有效的客户保留策略。该数据集自发布以来,已成为电信行业客户行为分析和预测模型研究的重要资源,推动了相关领域的研究进展。
当前挑战
Updated-Telecom-CDR-Dataset 面临的挑战主要集中在两个方面。其一,数据集中包含大量高维属性,如通话时长、通话费用、短信使用量等,这些属性之间存在复杂的相关性,如何有效提取特征并构建高精度的客户流失预测模型是一个关键问题。其二,数据集的构建过程中,如何确保数据的完整性和一致性,尤其是在处理大规模通话记录时,避免数据缺失或噪声干扰,是另一个重要挑战。此外,电信行业的客户行为具有动态性和多样性,如何捕捉这些变化并提升模型的泛化能力,也是研究者需要解决的核心问题。
常用场景
经典使用场景
在电信行业,Updated-Telecom-CDR-Dataset数据集被广泛应用于客户行为分析和流失预测。通过分析包含20个属性的101174条客户记录,研究人员能够深入理解客户的使用模式、服务偏好以及潜在的流失风险。这种分析不仅帮助电信公司优化服务策略,还能有效提升客户满意度和忠诚度。
衍生相关工作
基于Updated-Telecom-CDR-Dataset,许多经典的研究工作得以展开。例如,一些研究利用该数据集开发了先进的机器学习算法,用于客户细分和流失预测。这些工作不仅提升了预测模型的准确性,还为电信行业的客户关系管理提供了新的视角和方法。
数据集最近研究
最新研究方向
在电信领域,客户流失预测一直是研究的热点问题。Updated-Telecom-CDR-Dataset作为最新的通话详单数据集,包含了超过10万客户的20个属性,涵盖了客户的通话行为、套餐选择及流失情况等信息。近年来,基于该数据集的研究主要集中在利用机器学习算法进行客户流失预测模型的优化。研究者们通过分析客户的通话时长、短信使用量、国际通话频率等特征,结合深度学习和集成学习方法,提升预测的准确性和鲁棒性。此外,该数据集还被用于探索客户满意度与流失行为之间的关联,为电信运营商制定精准营销策略提供了数据支持。随着5G技术的普及和电信市场竞争的加剧,该数据集在客户行为分析和智能决策支持系统中的应用前景愈发广阔。
以上内容由遇见数据集搜集并总结生成



