five

tourismpackagenew

收藏
Hugging Face2025-09-03 更新2025-09-04 收录
下载链接:
https://huggingface.co/datasets/sathyam123/tourismpackagenew
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了与旅游相关的客户信息,包括客户是否购买产品、年龄、联系方式、所在城市等级、销售演讲时长、职业、性别、随行人数、后续跟进次数、推销的产品类型、偏好的房产星级、婚姻状况、旅行次数、是否拥有护照、演讲满意度评分、是否拥有汽车、随行儿童数量、客户职务和月收入等信息。
创建时间:
2025-08-29
原始信息汇总

数据集概述

基本信息

  • 数据集名称:Tourism Dataset
  • 存储位置:https://huggingface.co/datasets/sathyam123/tourismpackagenew
  • 下载大小:184,460 字节
  • 数据集大小:579,120 字节

数据内容

数据划分

  • 训练集:2,322 个样本,434,222 字节
  • 测试集:774 个样本,144,898 字节

特征列

  • ProdTaken:int64,表示客户是否购买了旅游产品
  • Age:float64,客户年龄
  • TypeofContact:string,联系方式(如自主查询、公司邀请)
  • CityTier:int64,客户所在城市等级
  • DurationOfPitch:float64,销售推介时长(分钟)
  • Occupation:string,职业
  • Gender:string,性别
  • NumberOfPersonVisiting:int64,同行人数
  • NumberOfFollowups:float64,跟进次数
  • ProductPitched:string,推介的产品类型
  • PreferredPropertyStar:float64,偏好的酒店星级
  • MaritalStatus:string,婚姻状况
  • NumberOfTrips:float64,旅行次数
  • Passport:int64,是否持有护照
  • PitchSatisfactionScore:int64,推介满意度评分
  • OwnCar:int64,是否拥有汽车
  • NumberOfChildrenVisiting:float64,同行儿童数量
  • Designation:string,职务
  • MonthlyIncome:float64,月收入
  • __index_level_0__:int64,索引列

用途

  • 预测客户是否购买产品(ProdTaken
  • 分析影响客户决策的因素
  • 基于客户特征和偏好进行客户分群

数据来源

模拟或收集的旅游公司客户互动与销售数据集,具体来源未明确说明。

许可信息

未指定许可证。

搜集汇总
数据集介绍
main_image_url
构建方式
在旅游行业客户行为分析领域,tourismpackagenew数据集通过系统化采集旅游企业客户交互数据构建而成。数据集整合了客户人口统计特征、产品推介记录及消费决策等多维度信息,采用结构化数据表形式组织,包含训练集与测试集分区,确保机器学习任务的数据完整性。数据字段经过标准化处理,涵盖年龄、收入、职业等20个特征变量,每个样本对应唯一客户标识符,所有数值型变量均经过归一化处理以消除量纲影响。
特点
该数据集的核心特征体现在其多维度的客户画像刻画能力,不仅包含基础人口统计学指标如年龄、性别、职业,还深度集成了消费行为特征包括旅行频率、产品偏好及服务满意度评分。特别值得注意的是,数据集通过量化指标如推介时长、跟进次数等动态交互数据,精准捕捉客户决策过程中的关键影响因素。类别型变量采用标准化编码,数值型变量保留连续特性,为研究客户消费决策机制提供丰富的数据支持。
使用方法
研究人员可借助该数据集构建旅游产品购买预测模型,以ProdTaken字段作为目标变量,运用逻辑回归、随机森林等分类算法进行训练。数据已预分为训练集(2322样本)和测试集(774样本),支持直接投入机器学习流程。在使用过程中建议对缺失值进行插补处理,对类别变量采用独热编码,并可通过特征重要性分析识别影响旅游产品转化的关键驱动因素,为旅游企业精准营销提供数据洞察。
背景与挑战
背景概述
旅游套餐预测数据集tourismpackagenew诞生于数字化营销蓬勃发展的时代背景下,由旅游行业数据分析专家团队构建。该数据集聚焦于旅游产品营销转化预测这一核心研究问题,通过整合客户人口统计学特征、消费行为数据及营销互动记录,为旅游企业提供精准营销决策支持。其多维度特征体系涵盖了年龄、职业、收入水平、产品偏好等关键变量,深刻反映了当代旅游消费市场的复杂特性,对推动旅游营销智能化转型具有重要实践价值。
当前挑战
该数据集面临的核心领域挑战在于高维稀疏特征下的客户行为预测难题,特别是如何从异构数据中有效提取影响购买决策的关键因子。构建过程中需克服多源数据融合的技术障碍,包括连续变量与分类变量的标准化处理、缺失值的合理插补以及类别不平衡问题的修正。此外,营销场景中的时序动态性和外部环境变量缺失,进一步增加了构建高质量预测模型的复杂度,要求研究者开发更先进的特征工程与模型集成方法。
常用场景
经典使用场景
在旅游营销分析领域,该数据集通过客户画像特征与消费行为数据的多维关联,为旅游产品购买预测模型提供标准化训练样本。研究人员利用年龄、收入、职业等人口统计学变量与旅游偏好特征的组合,构建高精度客户响应预测模型,典型应用于旅游企业精准营销策略的优化与评估。
实际应用
旅游企业依托该数据集开发智能推荐系统,通过分析客户历史行为与偏好特征,动态生成个性化旅游套餐方案。旅行社利用预测模型优化销售漏斗流程,基于客户画像精准分配营销资源,显著提升套餐转化率与客户满意度,实现数据驱动的精细化运营管理。
衍生相关工作
基于该数据集衍生的经典研究包括融合注意力机制的客户响应预测框架、基于集成学习的旅游需求分层模型,以及结合时空特征的动态推荐算法。这些成果发表于旅游管理、数据挖掘等领域顶级期刊,推动了旅游大数据分析的方法论体系构建与应用实践创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作