five

Salary Survey from AskAManager.org

收藏
github2024-03-01 更新2024-05-31 收录
下载链接:
https://github.com/masudsajid/Salary-Dataset-Analysis
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来自AskAManager.org的薪资调查,主要关注全球管理人员的薪资趋势和行业差异。数据集包含17个变量,其中有6个是自由文本输入,数据集是实时的,不断增长。

This dataset originates from the salary survey conducted by AskAManager.org, primarily focusing on global salary trends and industry disparities among management personnel. The dataset comprises 17 variables, including 6 that are free-text inputs. It is a real-time, continuously expanding dataset.
创建时间:
2024-02-01
原始信息汇总

数据集概述

数据集名称

  • Salary Dataset Analysis

数据集来源

  • 数据来自 AskAManager.org 的薪资调查。

数据集特征

  • 包含17个变量。
  • 其中6个变量为自由文本输入。
  • 数据集是“实时”更新的,不断增长。
  • 下载数据集时,包含一个“时间戳”变量(列A)。

数据集问题陈述

  1. 哪个行业支付的薪资最高?
  2. 随着工作经验的增加,薪资如何增长?
  3. 同一职位在不同地点的薪资比较如何?
  4. 不同性别和工作经验的薪资差异有多大?
  5. 种族和教育水平与薪资的关系如何?
  6. 是否存在一个“最佳”总工作经验与特定领域工作年限的组合?

技能/概念展示

  • Power BI
  • RStudio
  • 数据清洗
  • 按钮
  • 建模
  • 导航
  • 数据操作
  • 交互式仪表板

数据清洗步骤

  • 从实时Google表格中提取数据。
  • 类型转换。
  • 删除空行。
  • 处理行业列中的自由文本问题,通过创建新列和算法标准化行业名称。
  • 将国家列中的非空州值统一为“USA”。
  • 手动处理其他国家的不同写法。
  • 删除货币为其他类型的行。
  • 通过创建标准差列,过滤掉不切实际的收入值。

数据展示

  • 使用Power BI创建仪表板,展示不同国家的薪资趋势。
  • 限制每个变量在图表中的行数至少为15,以避免分析受异常值影响。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自AskAManager.org的薪酬调查,旨在揭示真实世界中的薪酬信息。数据收集通过在线表单进行,涵盖了多个国家的薪酬数据,尽管以美国为中心。数据集中包含17个变量,其中6个为自由文本输入,这导致了大量的数据清洗工作。数据集是动态的,随着时间的推移不断增长,且包含时间戳变量,便于模拟数据的增长过程。
特点
该数据集的特点在于其多样性和动态性。它不仅涵盖了广泛的行业和职位,还包含了地理位置、工作经验、性别、种族和教育水平等多个维度的信息。数据集中的自由文本输入增加了数据的复杂性,但也提供了更丰富的分析可能性。此外,数据集的动态增长特性使其能够反映最新的薪酬趋势。
使用方法
使用该数据集时,首先需要下载R脚本、Power BI仪表板和Excel表格,并确保它们位于同一文件夹中。在Power BI仪表板中,右键点击数据面板中的表格,选择“更改源”,并输入新的目录路径。通过这种方式,用户可以加载并分析数据集,探索不同行业、地理位置和经验水平下的薪酬差异,以及性别、种族和教育水平对薪酬的影响。
背景与挑战
背景概述
Salary Survey from AskAManager.org数据集源于AskAManager.org网站,旨在揭示真实世界中的薪资信息。该数据集由Masud Sajid等研究人员整理,主要聚焦于美国地区的薪资数据,同时也涵盖了其他国家的薪资信息。数据集的核心研究问题包括不同行业的薪资差异、工作经验对薪资的影响、地理位置对薪资的影响、性别与薪资的关系、种族与教育水平对薪资的关联等。该数据集为研究人员和从业者提供了一个宝贵的资源,帮助他们深入理解薪资分布及其影响因素,对人力资源管理和薪酬研究领域具有重要的参考价值。
当前挑战
Salary Survey from AskAManager.org数据集在构建和分析过程中面临多重挑战。首先,数据集中包含大量自由文本输入,导致数据清洗工作异常复杂,尤其是在处理行业名称和国别信息时,同一概念的不同表述增加了数据标准化的难度。其次,数据集为动态更新,需处理时间戳变量以模拟数据的增长,这对数据分析和建模提出了更高的要求。此外,数据集中存在异常值和不同货币单位,需通过统计方法和手动处理来确保数据的准确性和一致性。最后,如何在Power BI等工具中有效展示多维度的薪资趋势,同时避免异常值对分析结果的影响,也是该数据集分析中的一大挑战。
常用场景
经典使用场景
在薪酬研究领域,Salary Survey from AskAManager.org数据集被广泛用于分析不同行业、地区、性别及工作经验对薪酬的影响。研究者通过该数据集,能够深入探讨薪酬差异的根源,揭示不同职业和地区的薪酬分布规律。该数据集的多维度信息为薪酬公平性研究提供了丰富的数据支持。
解决学术问题
该数据集有效解决了薪酬研究中的多个关键问题,如行业薪酬差异、工作经验与薪酬增长的关系、性别薪酬差距等。通过数据清洗和分析,研究者能够识别出薪酬分布中的异常值和不一致性,进而提出更具针对性的薪酬政策建议。该数据集为学术界提供了宝贵的实证研究素材,推动了薪酬公平性和透明度的研究进展。
衍生相关工作
基于Salary Survey from AskAManager.org数据集,许多经典研究工作得以展开。例如,研究者利用该数据集开发了薪酬预测模型,分析了性别和种族对薪酬的影响,并探讨了教育水平与薪酬之间的关系。这些研究不仅丰富了薪酬领域的学术成果,还为政策制定者提供了科学依据,推动了薪酬公平性和透明度的提升。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作