anso4real/advertising
收藏Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/anso4real/advertising
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: 'Unnamed: 0'
dtype: int64
- name: TV
dtype: float64
- name: Radio
dtype: float64
- name: Newspaper
dtype: float64
- name: Sales
dtype: float64
splits:
- name: train
num_bytes: 8000
num_examples: 200
download_size: 7262
dataset_size: 8000
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
anso4real
搜集汇总
数据集介绍

构建方式
在广告效果分析领域,该数据集通过系统收集不同媒体渠道的广告投入与销售额之间的关联数据构建而成。数据涵盖电视、广播和报纸三种传统广告媒介的支出情况,并对应记录了相应的销售额表现,形成结构化的观测样本。这种构建方式旨在量化各广告渠道对销售结果的影响,为营销决策提供实证基础。
特点
该数据集以简洁而完整的特征结构呈现,包含四个核心数值变量:电视、广播和报纸的广告投入,以及销售额作为目标变量。所有特征均为连续型浮点数,确保了数据在计量分析中的适用性。数据规模适中,包含200条训练样本,适合用于回归建模、效果评估及媒体组合优化等典型广告分析任务。
使用方法
使用者可借助该数据集开展多元线性回归或机器学习建模,探究不同广告渠道对销售额的贡献程度。数据可直接用于训练预测模型,评估各媒体投入的边际效应,或进行预算分配模拟。在应用时,建议先进行描述性统计与相关性分析,以把握数据分布与变量间关系,进而建立科学的广告策略模型。
背景与挑战
背景概述
广告数据集作为营销分析与预测建模领域的经典资源,其创建可追溯至统计学与机器学习在商业决策中的早期应用阶段,通常由学术机构或行业研究团队为探究广告投入与销售响应关系而构建。该数据集聚焦于量化不同媒体渠道(如电视、广播、报纸)的广告支出对产品销售额的影响,核心研究问题在于揭示多元广告策略的效能评估与优化路径,为营销效果归因、预算分配及预测模型开发提供了实证基础,推动了计量经济学与数据科学在商业智能中的交叉融合。
当前挑战
该数据集所针对的领域挑战在于解决营销效果归因中的复杂性,即如何在多渠道广告环境下精确分离各媒介对销售结果的独立贡献,并克服变量间可能存在的共线性或交互效应干扰。在构建过程中,挑战主要体现在数据收集的可靠性与代表性上,需确保广告支出与销售数据的时空对齐、避免测量误差,并在有限样本规模下保持统计效力,同时需处理现实世界中媒体曝光重叠、外部市场因素混杂等噪声,以构建干净且可泛化的基准数据。
常用场景
经典使用场景
在市场营销与广告效果分析领域,Advertising数据集常被用于构建多元线性回归模型,以探究不同媒体渠道(如电视、广播和报纸)对销售额的影响。通过该数据集,研究者能够量化各广告投入与销售产出之间的线性关系,为广告预算分配提供数据驱动的决策依据。这一经典应用场景不仅揭示了媒体组合的协同效应,还促进了营销科学中因果推断方法的发展。
解决学术问题
该数据集有效解决了广告效果归因分析中的关键学术问题,即如何分离并评估多渠道广告对销售业绩的独立贡献。它通过提供结构化、可量化的真实世界数据,支持了回归分析、特征重要性评估等统计方法的验证与优化。这一贡献推动了营销计量经济学领域的实证研究,为理解广告投入的经济回报奠定了坚实的经验基础。
衍生相关工作
基于Advertising数据集,学术界衍生了一系列经典研究工作,包括但不限于正则化回归(如Lasso、Ridge)在特征选择中的应用、贝叶斯线性回归模型的构建,以及广告响应曲线的非线性拓展研究。这些工作不仅丰富了营销分析的方法论体系,还促进了机器学习与计量经济学的交叉融合,为后续大规模广告数据集的研究提供了重要参考。
以上内容由遇见数据集搜集并总结生成



