five

tourism-package-prediction-test

收藏
Hugging Face2025-09-06 更新2025-09-07 收录
下载链接:
https://huggingface.co/datasets/RandhirSingh23/tourism-package-prediction-test
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含产品销售信息和个人行为数据的训练数据集,包含了用户的年龄、联系方式、城市等级、演讲时长、职业、性别、访问人数、后续跟进次数、推荐产品、偏好房产星级、婚姻状况、旅行次数、护照拥有情况、演讲满意度、汽车拥有情况、儿童访问人数、职位、月收入等字段。
创建时间:
2025-09-01
原始信息汇总

数据集概述

基本信息

  • 数据集名称: tourism-package-prediction-test
  • 来源地址: https://huggingface.co/datasets/RandhirSingh23/tourism-package-prediction-test
  • 训练集样本数量: 826
  • 训练集大小: 154,442 字节
  • 下载大小: 23,158 字节
  • 数据集总大小: 154,442 字节

数据特征

数据集包含以下20个特征字段:

数值型特征

  • ProdTaken (int64)
  • Age (float64)
  • CityTier (int64)
  • DurationOfPitch (float64)
  • NumberOfPersonVisiting (int64)
  • NumberOfFollowups (float64)
  • PreferredPropertyStar (float64)
  • NumberOfTrips (float64)
  • Passport (int64)
  • PitchSatisfactionScore (int64)
  • OwnCar (int64)
  • NumberOfChildrenVisiting (float64)
  • MonthlyIncome (float64)
  • index_level_0 (int64)

分类型特征

  • TypeofContact (string)
  • Occupation (string)
  • Gender (string)
  • ProductPitched (string)
  • MaritalStatus (string)
  • Designation (string)

数据划分

  • 训练集: 包含826个样本,文件路径格式为 data/train-*
搜集汇总
数据集介绍
main_image_url
构建方式
在旅游营销分析领域,该数据集通过系统收集客户互动信息构建而成,涵盖了年龄、收入、联系方式等关键人口统计学和行为特征。数据源自真实的旅游产品推销记录,经过匿名化处理以确保隐私安全,并采用结构化表格形式整合多维度变量,为预测模型提供扎实的数据基础。
特点
数据集包含826条训练样本和19个特征字段,如客户购买决策、行程时长、满意度评分等,兼具数值型和分类型变量。其特色在于融合了消费行为与人口属性,且包含部分缺失值的真实场景模拟,为研究客户转化机制提供了高维度的分析空间。
使用方法
该数据集适用于旅游产品购买预测的监督学习任务,以ProdTaken作为目标变量,其余特征作为输入。研究者可借助机器学习算法如决策树或逻辑回归,构建分类模型以识别潜在客户,亦可深入分析特征相关性以优化营销策略。
背景与挑战
背景概述
旅游套餐预测测试数据集诞生于数字化营销蓬勃发展的时代,由旅游数据分析机构为提升客户转化率而构建。该数据集聚焦于通过客户 demographic 特征、消费行为与互动记录等多元维度,预测游客购买旅游套餐的意向。其核心研究问题在于如何利用机器学习模型精准识别潜在客户群体,从而优化营销策略分配。这一数据资源的建立为旅游服务业提供了实证研究基础,推动了个性化推荐系统在旅游领域的应用深化。
当前挑战
该数据集致力于解决旅游营销中的客户购买意向预测问题,其核心挑战在于高维稀疏特征的有效整合与类别不平衡样本的处理。构建过程中面临多重困难:原始数据来源多样导致的标准不统一、部分连续特征存在大量缺失值、以及敏感字段如月收入的隐私保护需求。此外,如何准确捕捉非线性的用户行为模式,并避免过拟合于特定 demographic 群体,亦是模型泛化能力的重要考验。
常用场景
经典使用场景
在旅游营销分析领域,该数据集被广泛应用于客户行为预测模型的构建与验证。通过整合游客人口统计特征、消费偏好及互动历史等多维变量,研究人员能够训练机器学习算法精准识别潜在的高价值客户群体,为旅游产品套餐的个性化推荐提供数据支撑。
衍生相关工作
基于该数据集衍生的研究包括融合深度学习的旅游需求预测模型、基于集成学习的客户价值评估框架等。这些工作不仅拓展了旅游大数据分析的方法体系,还催生了《Tourism Management》等期刊多项关于智能营销的实证研究,形成了跨计算机科学与旅游管理的交叉研究范式。
数据集最近研究
最新研究方向
在旅游营销预测领域,tourism-package-prediction-test数据集正推动客户行为分析与个性化推荐系统的深度融合。当前研究聚焦于集成多模态特征与时序行为数据,利用图神经网络捕捉客户-产品交互的复杂非线性关系。伴随生成式人工智能的兴起,该数据集被广泛应用于验证大语言模型在旅游产品转化预测中的解释性能力,其高维度客户画像特征为可解释性AI提供了理想验证场景。相关研究不仅优化了旅游企业的精准营销策略,还为跨行业客户生命周期价值预测模型提供了重要基准,显著提升了商业决策的科学性与前瞻性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作