OES, QCEW|劳动力市场数据集|职业统计数据集
收藏数据集概述
集成数据集
-
Occupational Employment Statistics (OES)
- 包含职业统计数据,主要关注就业、年龄和薪资。
- 数据访问起始年份为2014年。
- 更多信息可访问:OES
-
Quarterly Census of Employment and Wages (QCEW)
- 包含雇主报告的职业统计数据,可按地区、行业或公司规模进行数据切割。
- 注意数据类型可能与预期不符,需参考相关数据布局。
- 更多信息可访问:QCEW
数据集使用示例
-
OES示例
- 数据字段包括职业代码、职业名称、职业组、总就业人数、就业百分比、小时平均工资等。
- 示例查询:2017年总就业人数最高的职业。
-
QCEW示例
- 数据字段包括地区FIPS代码、所有权代码、行业代码、年份、季度、季度就业机构数等。
- 示例查询:2017年第一季度Fresno县的平均周薪。
注意事项
- OES
- 早期数据集存在特殊性,仅支持2014年及以后的数据访问。
- QCEW
- 数据类型可能与预期不符,需参考官方数据布局。
- 由于雇主保密,某些数据可能不可用,特别是在进行更细粒度的数据切割时。

CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录