saifhmb/social-network-ads
收藏Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/saifhmb/social-network-ads
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: Age
dtype: int64
- name: EstimatedSalary
dtype: int64
- name: Purchased
dtype: int64
splits:
- name: train
num_bytes: 9600
num_examples: 400
download_size: 3400
dataset_size: 9600
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for Social Network Ads Dataset
## Dataset Summary
The Social Network Ads Dataset is an English Language dataset containing 400 entries of customer information and their purchasing behavior
## Dataset Structure
### Data Instances
For each instance, there is an integer for the age, an integer for the estimated salary, and the purchased feature has 2 possible values , 0 and 1 which correspond to No and Yes respectively.
{'Age': '19',
'EstimatedSalary': '19000',
'Purchased': '0'}
### Data Fields
- **Age:** an integer stating the age of a customer
- **EstimatedSalary:** an integer stating the salary of the customer
- **Purchased:** an integer either 0 or 1, indicating no purchase or a purchase has occured
### Dataset Sources [optional]
<!-- Provide the basic links for the dataset. -->
- **Repository:** [More Information Needed]
- **Paper [optional]:** [More Information Needed]
- **Demo [optional]:** [More Information Needed]
## Uses
<!-- Address questions around how the dataset is intended to be used. -->
### Direct Use
<!-- This section describes suitable use cases for the dataset. -->
[More Information Needed]
### Out-of-Scope Use
<!-- This section addresses misuse, malicious use, and uses that the dataset will not work well for. -->
[More Information Needed]
## Dataset Structure
<!-- This section provides a description of the dataset fields, and additional information about the dataset structure such as criteria used to create the splits, relationships between data points, etc. -->
[More Information Needed]
## Dataset Creation
### Curation Rationale
<!-- Motivation for the creation of this dataset. -->
[More Information Needed]
### Source Data
<!-- This section describes the source data (e.g. news text and headlines, social media posts, translated sentences, ...). -->
#### Data Collection and Processing
<!-- This section describes the data collection and processing process such as data selection criteria, filtering and normalization methods, tools and libraries used, etc. -->
[More Information Needed]
#### Who are the source data producers?
<!-- This section describes the people or systems who originally created the data. It should also include self-reported demographic or identity information for the source data creators if this information is available. -->
[More Information Needed]
### Annotations [optional]
<!-- If the dataset contains annotations which are not part of the initial data collection, use this section to describe them. -->
#### Annotation process
<!-- This section describes the annotation process such as annotation tools used in the process, the amount of data annotated, annotation guidelines provided to the annotators, interannotator statistics, annotation validation, etc. -->
[More Information Needed]
#### Who are the annotators?
<!-- This section describes the people or systems who created the annotations. -->
[More Information Needed]
#### Personal and Sensitive Information
<!-- State whether the dataset contains data that might be considered personal, sensitive, or private (e.g., data that reveals addresses, uniquely identifiable names or aliases, racial or ethnic origins, sexual orientations, religious beliefs, political opinions, financial or health data, etc.). If efforts were made to anonymize the data, describe the anonymization process. -->
[More Information Needed]
## Bias, Risks, and Limitations
<!-- This section is meant to convey both technical and sociotechnical limitations. -->
[More Information Needed]
### Recommendations
<!-- This section is meant to convey recommendations with respect to the bias, risk, and technical limitations. -->
Users should be made aware of the risks, biases and limitations of the dataset. More information needed for further recommendations.
## Citation [optional]
<!-- If there is a paper or blog post introducing the dataset, the APA and Bibtex information for that should go in this section. -->
**BibTeX:**
[More Information Needed]
**APA:**
[More Information Needed]
## Glossary [optional]
<!-- If relevant, include terms and calculations in this section that can help readers understand the dataset or dataset card. -->
[More Information Needed]
## More Information [optional]
[More Information Needed]
## Dataset Card Authors [optional]
[More Information Needed]
## Dataset Card Contact
[More Information Needed]
数据集元信息:
特征字段:
- 名称:Age(年龄),数据类型:int64
- 名称:EstimatedSalary(预估薪资),数据类型:int64
- 名称:Purchased(购买状态),数据类型:int64
数据划分:
- 划分名称:train(训练集),字节占用:9600,样本数量:400
下载总大小:3400,数据集总存储大小:9600
配置项:
- 配置名称:default(默认配置),数据文件:
- 对应划分:train,文件路径:data/train-*
# 社交网络广告数据集(Social Network Ads Dataset)数据集卡片
## 数据集概述
社交网络广告数据集为英文语言数据集,包含400条客户信息及其购买行为样本。
## 数据集结构
### 数据样本
每条样本包含客户年龄、预估薪资以及购买状态三个整数字段。其中购买状态字段仅包含0和1两个取值,分别对应“未购买”与“已购买”。
示例如下:
{'Age': '19',
'EstimatedSalary': '19000',
'Purchased': '0'}
### 数据字段说明
- **Age(年龄)**:表示客户年龄的整数值
- **EstimatedSalary(预估薪资)**:表示客户预估薪资的整数值
- **Purchased(购买状态)**:取值为0或1的整数,0代表未发生购买行为,1代表已发生购买行为
## 数据集来源[可选]
<!-- 请提供数据集的基础链接信息。 -->
- **代码仓库**:[需补充更多信息]
- **相关论文[可选]**:[需补充更多信息]
- **演示示例[可选]**:[需补充更多信息]
## 数据集用途
<!-- 请说明该数据集的预期使用场景。 -->
### 直接用途
<!-- 本小节描述该数据集的适用场景。 -->
[需补充更多信息]
### 不适用场景
<!-- 本小节说明数据集的误用、恶意使用场景,以及该数据集无法适配的使用场景。 -->
[需补充更多信息]
## 数据集结构
<!-- 本小节提供数据集字段的详细说明,以及数据集结构的额外信息,例如划分集的创建准则、数据点间的关联关系等。 -->
[需补充更多信息]
## 数据集构建
### 构建初衷
<!-- 说明创建该数据集的动机。 -->
[需补充更多信息]
### 源数据
<!-- 本小节描述源数据的相关信息,例如新闻文本与标题、社交媒体帖子、翻译语句等。 -->
#### 数据收集与处理流程
<!-- 本小节描述数据收集与处理的过程,例如数据筛选准则、过滤与归一化方法、使用的工具与库等。 -->
[需补充更多信息]
#### 源数据生产者
<!-- 本小节描述原始创建该数据的个人或系统。若可获取源数据创建者的自我报告人口统计或身份信息,请一并说明。 -->
[需补充更多信息]
### 标注信息[可选]
<!-- 若数据集包含初始数据收集之外的标注内容,请使用本小节描述相关信息。 -->
#### 标注流程
<!-- 本小节描述标注流程,例如标注过程中使用的工具、标注的数据量、提供给标注人员的标注指南、标注者间一致性统计、标注验证方式等。 -->
[需补充更多信息]
#### 标注人员
<!-- 本小节描述创建标注内容的个人或系统。 -->
[需补充更多信息]
#### 个人与敏感信息说明
<!-- 说明该数据集是否包含可被视为个人、敏感或隐私的数据(例如:泄露地址、唯一可识别的姓名或别名、种族或族裔起源、性取向、宗教信仰、政治观点、财务或健康数据等)。若已对数据进行匿名化处理,请描述匿名化处理的过程。 -->
[需补充更多信息]
## 偏差、风险与局限性
<!-- 本小节用于说明技术与社会技术层面的局限性。 -->
[需补充更多信息]
### 建议
<!-- 本小节用于说明针对该数据集的偏差、风险与技术局限性的相关建议。 -->
用户应知晓该数据集存在的风险、偏差与局限性,需补充更多信息以提供进一步的建议。
## 引用信息[可选]
<!-- 若存在介绍该数据集的论文或博客文章,请在此处提供其APA与BibTeX格式的引用信息。 -->
**BibTeX格式引用:**
[需补充更多信息]
**APA格式引用:**
[需补充更多信息]
## 术语表[可选]
<!-- 若有需要,请在此处添加可帮助读者理解数据集或数据集卡片的术语与计算公式。 -->
[需补充更多信息]
## 更多信息[可选]
[需补充更多信息]
## 数据集卡片作者[可选]
[需补充更多信息]
## 数据集卡片联系人
[需补充更多信息]
提供机构:
saifhmb
原始信息汇总
数据集卡片:社交网络广告数据集
数据集概述
社交网络广告数据集是一个包含400条客户信息及其购买行为的英语数据集。
数据集结构
数据实例
每个实例包含以下字段:
- Age: 表示客户年龄的整数。
- EstimatedSalary: 表示客户薪资的整数。
- Purchased: 表示是否购买的整数,0表示未购买,1表示已购买。
示例: json { "Age": "19", "EstimatedSalary": "19000", "Purchased": "0" }
数据字段
- Age: 整数,表示客户年龄。
- EstimatedSalary: 整数,表示客户薪资。
- Purchased: 整数,0或1,表示未购买或已购买。
数据集配置
- 配置名称: default
- 数据文件:
- split: train
- path: data/train-*
数据集大小
- 下载大小: 3400字节
- 数据集大小: 9600字节
- 训练集:
- num_bytes: 9600字节
- num_examples: 400条
搜集汇总
数据集介绍

构建方式
在探索社交媒体广告效果与用户购买行为之间的关联性领域,saifhmb/social-network-ads数据集应运而生。该数据集的构建基于对客户信息与购买行为的采集,共包含400条记录。每条记录详细涵盖了客户的年龄、预估薪资以及是否购买的二元特征。数据集的构建过程中,对原始数据进行了严格的筛选与处理,确保了数据质量与可用性。
特点
saifhmb/social-network-ads数据集的特点在于其简洁明了的结构与直接关联的实际应用背景。数据字段包括年龄、预估薪资和购买行为,这些信息为研究社交媒体广告定向投放的有效性提供了基础数据支持。此外,数据集的规模适中,便于在多种计算环境中进行处理与分析,特别适用于机器学习模型的训练与评估。
使用方法
使用saifhmb/social-network-ads数据集时,用户首先需要通过HuggingFace提供的接口下载相应的训练数据集。随后,用户可以根据数据集的结构,对数据进行预处理,如归一化、编码等,以适应不同模型的输入需求。在数据准备完毕后,用户可以利用这些数据进行机器学习模型的训练,进而对社交媒体广告的投放效果进行预测分析。
背景与挑战
背景概述
社会网络广告数据集(Social Network Ads Dataset)是一款以英语为载体的数据集,其汇聚了400条客户信息及其购买行为的记录。该数据集的构建旨在探索社会网络广告与消费者购买行为之间的关联性,为市场营销领域提供了宝贵的研究资源。自创建以来,该数据集便成为了研究者在广告投放策略优化、消费者行为分析等领域的重要工具。尽管具体创建时间和主要研究人员或机构的信息尚未明确,其影响力在学术界和业界已是不容小觑。
当前挑战
该数据集在解决社会网络广告领域问题,如如何更精准定位潜在消费者、如何评估广告效果等方面面临挑战。数据集构建过程中所遇到的挑战包括数据收集的真实性和代表性,以及如何处理个人敏感信息以确保隐私保护。此外,由于数据集规模有限,其模型的泛化能力也受到考验,需要研究者在应用时谨慎处理。
常用场景
经典使用场景
在社会科学与市场营销研究领域,saifhmb/social-network-ads数据集被广泛用于分析用户年龄、收入与其购买行为之间的关联。该数据集包含400条客户信息,通过深入挖掘这些数据,研究者能够构建出预测模型,以评估广告推广的有效性。
衍生相关工作
基于saifhmb/social-network-ads数据集的研究成果,衍生出了众多关于用户行为预测和广告效果评估的经典工作。这些研究不仅推动了相关领域的理论发展,也为实际营销活动提供了科学依据。
数据集最近研究
最新研究方向
在社会网络广告领域,saifhmb/social-network-ads数据集的最新研究方向主要聚焦于用户购买行为预测。该数据集包含400条客户信息及购买行为记录,研究人员通过对年龄、预估收入等特征的分析,旨在构建更为精准的预测模型,以提升广告投放的效率和转化率。近期研究不仅关注模型的准确性,还重视模型的可解释性,以增强广告策略的透明度和用户的信任度。在此背景下,该数据集对于理解消费者行为、优化广告策略具有重要意义,为广告营销领域的智能化决策提供了有力支撑。
以上内容由遇见数据集搜集并总结生成



