five

OES, QCEW|劳动力市场数据集|职业统计数据集

收藏
github2020-05-06 更新2024-05-31 收录
劳动力市场
职业统计
下载链接:
https://github.com/mbkupfer/bls-datasets
下载链接
链接失效反馈
资源简介:
OES包含职业统计数据,主要包括就业、年龄和薪资。QCEW包含雇主报告的职业统计数据,数据可以根据地区、行业或公司规模进行切割。

The OES (Occupational Employment Statistics) encompasses occupational statistical data, primarily including employment, age, and salary information. The QCEW (Quarterly Census of Employment and Wages) contains occupational statistical data reported by employers, which can be segmented by region, industry, or company size.
创建时间:
2018-10-05
原始信息汇总

数据集概述

集成数据集

  1. Occupational Employment Statistics (OES)

    • 包含职业统计数据,主要关注就业、年龄和薪资。
    • 数据访问起始年份为2014年。
    • 更多信息可访问:OES
  2. Quarterly Census of Employment and Wages (QCEW)

    • 包含雇主报告的职业统计数据,可按地区、行业或公司规模进行数据切割。
    • 注意数据类型可能与预期不符,需参考相关数据布局。
    • 更多信息可访问:QCEW

数据集使用示例

  • OES示例

    • 数据字段包括职业代码、职业名称、职业组、总就业人数、就业百分比、小时平均工资等。
    • 示例查询:2017年总就业人数最高的职业。
  • QCEW示例

    • 数据字段包括地区FIPS代码、所有权代码、行业代码、年份、季度、季度就业机构数等。
    • 示例查询:2017年第一季度Fresno县的平均周薪。

注意事项

  • OES
    • 早期数据集存在特殊性,仅支持2014年及以后的数据访问。
  • QCEW
    • 数据类型可能与预期不符,需参考官方数据布局。
    • 由于雇主保密,某些数据可能不可用,特别是在进行更细粒度的数据切割时。
AI搜集汇总
数据集介绍
main_image_url
构建方式
OES与QCEW数据集均由美国劳工统计局(BLS)构建,前者包含详细的职业就业、年龄及薪资统计信息,后者涵盖雇主报告的职业统计数据。数据集的构建基于官方统计调查,并整合至bls-datasets库中,便于Python脚本访问。OES数据集自2014年起提供,而QCEW数据集可根据地区、行业或公司规模进行数据切片。
特点
OES数据集特点在于提供了职业的就业总数、平均工资及不同分位数的工资分布,而QCEW数据集特点在于提供按季度划分的就业 establishment 数据,包括工资、税务及就业变化等维度。两者均注重数据隐私,对部分敏感数据进行匿名处理,并在数据集中包含披露代码以指示数据可用性。
使用方法
用户可通过bls-datasets库中的oes与qcew模块获取数据,利用get_data函数根据年份、地区、行业等参数进行数据查询。例如,获取2017年OES数据只需调用oes.get_data(year=2017),而获取特定地区Q1季度的平均周收入则需通过qcew.get_data函数与相应的筛选条件。在使用数据前,用户应检查disclosure_code列以确认数据的可用性。
背景与挑战
背景概述
OES(Occupational Employment Statistics)与QCEW(Quarterly Census of Employment and Wages)数据集是由美国劳工统计局(Bureau of Labor Statistics, BLS)提供的重要资源。OES数据集包含了不同职业的就业、年龄和薪资统计信息,而QCEW数据集则涵盖了雇主报告的职业统计数据,可按地区、行业或公司规模进行切分。这两个数据集自2014年起向公众提供,对于研究劳动市场动态、职业发展趋势以及薪资水平变化具有极高的参考价值,被广泛用于政策制定、市场分析和学术研究等领域。
当前挑战
在研究领域中,这两个数据集面临的挑战主要包括数据完整性的验证,尤其是QCEW数据集中由于雇主保密性导致的某些数据不可用的问题。此外,数据集的处理和整合过程中,由于数据类型的不一致性和不同版本数据间的命名模式差异,对研究人员的分析能力提出了较高的要求。同时,如何确保数据集的及时更新与准确性,以适应不断变化的劳动市场,也是数据集维护者面临的挑战之一。
常用场景
经典使用场景
在社会科学与劳动市场研究领域,OES与QCEW数据集被广泛用于分析职业就业与薪资水平。其经典使用场景在于,研究者可通过数据集深入挖掘不同职业的就业人数、薪资分布以及行业变化趋势,进而为职业规划、教育培训及政策制定提供数据支持。
解决学术问题
该数据集解决了职业就业统计的时效性与准确性问题,为学术界提供了详尽的职业薪资与就业数据,有助于研究者准确把握劳动力市场的动态变化,从而促进相关领域的学术研究与理论发展。
衍生相关工作
基于OES与QCEW数据集,衍生出了一系列相关研究工作,如职业薪资差距分析、行业就业趋势预测及地区经济发展评估等。这些工作不仅丰富了劳动经济学的研究领域,也为社会经济发展提供了重要的决策参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录