five

hugginglearners/data-science-job-salaries

收藏
Hugging Face2022-08-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hugginglearners/data-science-job-salaries
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了数据科学相关职位的薪资信息。数据集中的列包括工作年份、经验水平、雇佣类型、职位名称、薪资、薪资货币、薪资(以美元计)、员工居住地、远程工作比例、公司所在地和公司规模。这些信息可以帮助分析数据科学领域的薪资趋势和分布。

This dataset contains salary information for data science-related positions. The columns included in the dataset are work year, experience level, employment type, job title, salary, salary currency, salary (in USD), employee residence, remote work ratio, company location, and company size. This information can facilitate the analysis of salary trends and distributions in the data science domain.
提供机构:
hugginglearners
原始信息汇总

数据集概述

数据集描述

  • 数据集名称: Data Science Job Salaries
  • 数据集摘要: 该数据集包含关于数据科学工作薪资的详细信息,包括工作年份、经验水平、雇佣类型、职位、薪资、薪资货币、薪资换算为美元、员工居住地、远程工作比例以及公司位置和规模。

数据集内容

列名 描述
work_year 薪资支付的年份。
experience_level 工作年份中的经验水平,可能值包括:EN(入门级/初级)、MI(中级/中级)、SE(高级/专家)、EX(执行级/总监)。
employment_type 职位的雇佣类型,可能值包括:PT(兼职)、FT(全职)、CT(合同)、FL(自由职业)。
job_title 该年份中担任的职位。
salary 支付的总薪资金额。
salary_currency 支付薪资的货币,采用ISO 4217货币代码。
salary_in_usd 薪资换算为美元的金额。
employee_residence 员工在该工作年份的主要居住国家,采用ISO 3166国家代码。
remote_ratio 远程工作比例,可能值包括:0(无远程工作)、50(部分远程)、100(完全远程)。
company_location 雇主主要办公室或合同分支所在的国家,采用ISO 3166国家代码。
company_size 该年份公司平均员工人数,可能值包括:S(少于50人)、M(50至250人)、L(超过250人)。

许可证信息

  • 许可证: cc0-1.0

数据集创建者

搜集汇总
数据集介绍
main_image_url
构建方式
数据集构建的过程涉及从ai-jobs.net等来源聚合数据科学领域的薪资信息。该数据集通过规范化初始数据,并对薪资进行货币汇率转换,确保了数据的一致性和可用性。数据涵盖多个字段,包括工作年份、经验水平、就业类型、职位、薪资及其货币类型、员工居住地、远程工作比例和公司规模等,以ISO标准代码形式统一了国家/地区和货币的表示。
特点
本数据集的特点在于其提供了全球范围内数据科学岗位的薪资概况,包含了丰富的特征信息,如薪资货币类型、薪资换算成美元的金额、员工居住地以及公司所在地等。这些信息有助于分析不同地区、不同经验水平和不同公司规模对薪资的影响,为数据科学领域的工作者提供了宝贵的参考。
使用方法
使用该数据集时,用户可以首先根据需要选择相应的字段进行分析,如按年份、地区、经验水平或公司规模等维度进行薪资水平的比较。数据集支持多种任务,用户需根据具体任务需求对数据进行适当的预处理,如处理缺失值、标准化字段等,以适应不同的模型和算法。此外,用户在使用数据集时应当遵循CC0-1.0协议,尊重数据共享的原则。
背景与挑战
背景概述
数据科学岗位薪酬数据集(Data Science Job Salaries)的构建旨在为数据科学领域内的薪酬研究提供详实的数据支持。该数据集由Kaggle用户ruchi798分享,收集了不同年份、不同经验级别、不同雇佣类型的数据科学岗位的薪酬信息,包括薪资总额、薪资货币类型、薪资换算成美元的金额、员工主要居住地、远程工作比例以及公司所在地和规模等。该数据集的创建,不仅为薪酬趋势分析提供了基础,也为数据科学职业发展及相关政策制定提供了参考依据。
当前挑战
在构建数据科学岗位薪酬数据集的过程中,面临的挑战主要包括数据收集的全面性和准确性,以及如何确保个人和敏感信息的安全。数据集需解决如何准确反映不同地区、不同级别和不同类型的数据科学岗位薪酬差异的问题。此外,数据集在处理和标注过程中,还需克服如何保持客观性和避免引入偏见等难题。在使用该数据集时,还需考虑数据的社会影响,如可能存在的薪酬偏见和隐私保护等问题。
常用场景
经典使用场景
在数据科学职业薪资这一领域,该数据集被广泛应用于薪资趋势分析,通过对不同年份、经验级别、就业类型等维度的薪资数据进行统计分析,研究者能够描绘出数据科学职业市场的薪资地图。
实际应用
在实际应用中,该数据集被人力资源部门、职业规划顾问及教育机构用于指导职业发展和薪资谈判,同时为企业招聘提供了市场薪资参考。
衍生相关工作
基于该数据集,衍生了一系列相关研究工作,包括薪资预测模型、职业发展路径分析、行业薪资差异研究等,进一步丰富了数据科学职业薪资领域的研究成果。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作