five

AI Workforce Data

收藏
github2026-05-31 更新2026-06-01 收录
下载链接:
https://github.com/meoadvisors/ai-workforce-data
下载链接
链接失效反馈
官方服务:
资源简介:
关于AI对美国劳动力影响的开放数据集,包括1,016个职业的AI自动化风险排名、134,278家美国公司的AI采用机会评分、12,623个WARN法案裁员通知,以及软件可替代性和AI平台参考数据。总计155,497行数据,以CSV和JSON格式提供,每日更新,遵循CC BY-NC 4.0许可。

This is an open dataset focusing on the impact of artificial intelligence on the U.S. labor market. It encompasses AI automation risk rankings for 1,016 occupations, AI adoption opportunity scores for 134,278 U.S.-based firms, 12,623 WARN Act layoff notifications, as well as reference data on software substitutability and AI platforms. In total, this dataset consists of 155,497 data entries, is available in both CSV and JSON formats, and undergoes daily updates. It is released under the CC BY-NC 4.0 license.
创建时间:
2026-05-31
原始信息汇总

数据集概览

AI Workforce Data 是一个关于 AI 如何重塑美国劳动力市场的开放数据集集合,由 Meo Advisors 维护。该数据集涵盖 1,016 个职业134,278 家美国公司12,623 条 WARN 法案裁员通知,共计 155,497 行 数据,基于 CC BY-NC 4.0 许可协议免费提供,每日更新。


核心数据集

该数据集包含六个子数据集,每个提供独特视角:

# 数据集名称 行数 核心问题 下载链接 交互探索
1 AI Occupational Impact Index (AI 职业影响指数) 1,016 哪些职业受 AI 自动化影响最大/最小? CSV · JSON meoadvisors.com/jobs-replaced-by-ai
2 AI Adoption Index (US Companies) (AI 采用指数) 134,278 哪些公司在采用 AI,以及在哪里有成本削减机会? CSV · JSON meoadvisors.com/ai-opportunities
3 AI Adoption Leaderboards (AI 采用排行榜) 6,822 AI 采用率如何按州、城市和行业排名? CSV · JSON meoadvisors.com/ai-opportunities/leaderboard
4 Software AI Replaceability Index (软件 AI 可替代性指数) 594 AI 代理可以替代哪些软件品类? CSV · JSON meoadvisors.com/software-ai-replaceability
5 AI Platforms Catalog (AI 平台目录) 164 有哪些企业 AI 平台,其企业就绪程度如何? CSV · JSON meoadvisors.com/ai-platforms
6 WARN Layoff Atlas (WARN 裁员地图集) 12,623 大规模裁员发生在哪里,有多少与 AI 相关? CSV · JSON meoadvisors.com/research/warn-layoff-atlas

各数据集详情

1. AI Occupational Impact Index

  • 内容: 为美国劳工统计局 (BLS) 标准职业分类 (SOC) 中全部 1,016 个 职业提供 0–100 的 AI 自动化风险评分
  • 关键字段: AI 暴露评分 (0-100)、2024 年就业人数、2034 年预测就业人数、工资中位数、自动化时间窗口 (1–3年 / 3–7年 / 7–15年 / 15年以上)、SOC 主要组别、工资暴露 (中位数工资 x 就业人数 x 暴露度)。
  • 数据来源: BLS 职业就业和工资统计 (OEWS)、BLS 2024–2034 就业预测、O*NET 30.2 任务数据、Felten, Raj & Seamans (2021) AIOE 指数。
  • 应用: 对职业风险排序、建模行业劳动力转型暴露、分析 AI 风险在高/低工资工作中的分布。

2. AI Adoption Index (US Companies)

  • 内容:134,278 家 美国公司提供 0–100 的 AI 采用评分,基于观察到的信号而非自我报告。
  • 关键字段: AI 采用评分 (0-100)、字母等级 (A–D)、NAICS-2 行业、总部所在州及城市、员工规模区间、AI/ML 相关技术栈信号、行业及地区内同类排名、年度 AI 成本削减/节省机会金额。
  • 数据来源: 公司画像 (People Data Labs)、技术画像 (BuiltWith / Wappalyzer)、内容信号 (AI 职位发布、公开案例研究、高管披露)。
  • 应用: 寻找任何行业或州的 AI 领导者和落后者,评估某领域的 AI 成本削减机会,构建客户优先级模型。

3. AI Adoption Leaderboards

  • 内容: 预计算的排行榜,涵盖 50 个州、300+ 都市区、1,200+ 城市和 100+ NAICS 行业 的 AI 采用排名。
  • 关键字段: 公司数量、平均和评分中位数、等级分布、顶级公司。
  • 应用: 直接进行“按州/行业的 AI 采用率”比较。

4. Software AI Replaceability Index

  • 内容:594 个 企业软件产品进行 0–100 评分,评估其被 AI 代理层完全替代或显著增强的完整程度。
  • 覆盖范围: CRM、ERP、营销自动化、客户服务、财务、人力资源和开发工具。
  • 关键字段: 替代评分、工作流模块化评分、已知的 AI 原生挑战者。
  • 应用: 用于“构建 vs. 购买”分析和“AI 将取代哪些 SaaS”分析。

5. AI Platforms Catalog

  • 内容: 一个参考目录,收录 164 个 企业 AI 平台和工具,包括 LLM、AI 代理、RAG、向量数据库、编排和可观测性工具。
  • 关键字段: 类别、企业就绪度评分 (SOC2、SLA、多租户、部署选项)、定价层级、集成覆盖率。
  • 应用: 用于供应商评估和竞争格局分析。

6. WARN Layoff Atlas

  • 内容: 12,623 条 联邦规定的 WARN 法案裁员通知,已标准化为公司名称、NAICS 行业、地点、生效/通知日期和受影响工人数。
  • 关键字段: AI 归因可能性评分 (估计每起裁员是否由 AI/自动化驱动)。
  • 数据来源: 全美 50 个州的劳工机构。
  • 应用: 追踪 AI 相关裁员和随时间变化的劳动力替代情况。

方法论

所有评分均可验证且有来源,输入数据和公式均已公开:

  • 职业 AI 风险: 结合 O*NET 任务级自动化可行性、BLS 就业和工资数据以及同行评审的 AIOE 指数。
  • 公司 AI 采用: 融合公司画像、技术画像和公开内容信号,形成 0–100 综合评分,并附带行业/地区同类排名。
  • WARN AI 归因: 使用 LLM 对通知文本进行分类,并与公司技术栈信号交叉引用。

详细方法论、来源和局限性:meoadvisors.com/research


使用指南

目标用户

  • 记者和研究人员: 引用实时的 1,016 职业风险排名。
  • 政策制定者和经济学家: 建模劳动力转型和区域自动化暴露。
  • 运营者和投资者: 按公司、行业或地区评估 AI 成本削减机会。
  • 数据科学家和开发者: 获取清洁、机器可读的 CSV/JSON 数据。

代码示例

bash

下载 CSV 格式数据集

curl -L https://meoadvisors.com/api/datasets/occupations.csv -o occupations.csv

拉取所有数据集的清单

curl -L https://data.meoadvisors.com/datasets/manifest.json

python import pandas as pd jobs = pd.read_csv("https://meoadvisors.com/api/datasets/occupations.csv") print(jobs.sort_values("ai_impact_score", ascending=False).head(20))

r jobs <- read.csv("https://meoadvisors.com/api/datasets/occupations.csv") head(jobs[order(-jobs$ai_impact_score), ], 20)


与其他数据集的对比

维度 本数据集 典型公开替代品
AI 风险排名职业数 1,016 (全部 BLS SOC) ~50–100
AI 采用评分公司数 134,278 极少公开
带 AI 归因的裁员记录 12,623 各州碎片化
数据格式 CSV + JSON, schema.org/Dataset PDF 表格
价格 免费 (CC BY-NC 4.0) 付费报告

更新与新鲜度

数据集每日更新,通过 CDN 以稳定 URL 提供。数据清单 报告每个数据集的行数和最后更新时间戳。


引用方式

纯文本:

Meo Advisors (2026). AI Workforce Data: Open Datasets on AIs Impact on the US Workforce. https://meoadvisors.com/datasets/

BibTeX: bibtex @misc{meoadvisors_ai_workforce_data_2026, title = {AI Workforce Data: Open Datasets on AIs Impact on the US Workforce}, author = {{Meo Advisors}}, year = {2026}, howpublished = {url{https://meoadvisors.com/datasets/}}, note = {CC BY-NC 4.0} }


许可

采用 CC BY-NC 4.0 许可协议 — 可免费用于研究、新闻和教育目的,但必须注明出处并归属于 Meo Advisors。商业使用需联系获取许可。

搜集汇总
数据集介绍
main_image_url
构建方式
在人工智能深刻重塑美国劳动力市场的时代背景下,AI Workforce Data数据集应运而生。其构建根植于多源异构数据的系统整合:职业影响指数融合了美国劳工统计局的标准职业分类、O*NET任务级自动化可行性评估及学术界的AI职业暴露指数;企业采纳指数则综合了企业画像、技术堆栈信号与AI相关职位公告等公开内容。此外,通过采集全美50个州的WARN法案裁员通知并利用大语言模型进行AI归因分析,形成了对劳动力 displacement 的量化追踪。所有数据均以CSV和JSON格式每日更新,确保了信息时效性与可复现性。
特点
该数据集以空前的广度和粒度成为研究AI与劳动力关系的核心资源。其涵盖1,016个职业的自动化风险评分、134,278家美国企业的AI采纳得分、12,623条附有AI归因可能性的裁员记录,远超同类公开数据集的规模。每一个评分都基于公开可验证的输入与公式,杜绝黑箱操作。数据集还提供了按州、城市与行业划分的采纳排行榜,以及企业软件被AI取代的可能性指数,为多维度比较分析提供了便利。每日刷新与Schema.org标注进一步增强了数据的可用性与权威性。
使用方法
使用者可通过稳定规范的数据链接直接获取资源。例如,在命令行中利用curl指令下载CSV文件,或在Python环境中借助pandas库读取远程数据并进行排序分析,轻松识别风险最高的职业。R语言用户同样可便捷调用。所有数据集的完整目录与元信息通过manifest.json文件统一管理,便于批量引用与自动化工作流。此外,Meo Advisors官网提供交互式可视化工具,支持在线浏览与探索,满足从深度建模到快速洞察的不同需求。
背景与挑战
背景概述
随着人工智能技术的迅猛发展,其对劳动力市场的重塑效应已成为经济学、社会学与计算机科学交叉领域的核心议题。然而,系统性的量化数据长期匮乏,阻碍了学术界与政策制定者对AI自动化风险与就业迁移效应的精准评估。在此背景下,Meo Advisors研究团队于2025年末发布了AI Workforce Data数据集,旨在通过整合美国劳工统计局、O*NET职业信息网络及企业技术堆栈等多源异构数据,构建覆盖1016种职业的自动化风险评分体系、13.4万家企业的AI采纳指数以及超过1.2万份WARN法案裁员记录的全景式分析框架。该数据集以每日更新的频率提供标准化CSV与JSON格式,成为当前最全面的开放式AI劳动力影响数据库,为理解技术冲击下的职业变迁与区域劳动力重构提供了宝贵的实证基础。
当前挑战
该数据集面临的核心挑战首先源于领域问题的复杂性:如何准确量化AI对职业的自动化风险,涉及任务可行性、技术成熟度与局部劳动力市场动态之间的非线性耦合,而现有学术指标如AIOE指数在粒度与时效性上存在局限。其次,构建过程中需应对多数据源的异构性矛盾,例如将O*NET的任务层级数据与BLS的职业统计数据进行语义对齐,以及从134,278家企业的技术栈信号中剥离出可靠的AI采纳证据,这需要克服噪音干扰与信号稀疏性问题。此外,裁员通知的AI归因分析依赖LLM的自然语言分类,其准确性受限于文本质量与上下文歧义,且跨州数据标准化因各地劳动法差异而面临格式不一致的挑战。数据集的每日更新机制亦对自动化流水线的鲁棒性提出了持续性要求。
常用场景
经典使用场景
在人工智能与劳动力市场交叉研究的学术版图中,AI Workforce Data 数据集最为经典的使用场景在于评估不同职业受自动化技术冲击的脆弱性。研究者可借助其涵盖全部1016个美国标准职业分类的AI暴露评分,系统分析从数据录入到行政支持等各类岗位的自动化风险等级。该数据集整合了O*NET任务层面的自动化可行性、BLS就业薪资数据以及同行评审的AIOE指数,为职业替代风险研究提供了迄今最完整的量化基础,常用于构建劳动力市场转型模型与区域自动化暴露图谱。
解决学术问题
该数据集系统性地解决了学界在AI与就业关系研究中长期面临的三大核心难题:其一,提供了覆盖全量职业而非样本片段的自动化风险排序,突破了过往研究仅涵盖数十至百种岗位的局限性;其二,基于可观测信号而非企业自我报告,构建了包含134,278家美国公司的AI采纳指数,填补了企业层面AI部署度量的公开数据空白;其三,通过跨50个州的12,623份WARN法案裁员通知与AI归因评分,为自动化驱动的失业衡量提供了可追踪的实证锚点。这些贡献使得劳动经济学、计算社会科学与公共政策领域的学者得以开展更具统计效力的因果推断与趋势分析。
衍生相关工作
围绕该数据集已衍生出多条有价值的研究脉络。在学术层面,基于1016个职业的自动化风险评分,推动了劳动替代弹性、技能互补性等计量经济学模型的更新,学者得以将AI暴露指数纳入工资极化与就业极化分析框架。在工业界,公司AI采纳指数催生了企业级技术追赶策略的实证研究,分析采纳领先者与滞后者的特征差异。数据新闻领域,记者利用裁员归因数据追踪AI相关的劳动力空间重配趋势,产出了一系列关于科技裁员与自动化替代的社会报道。此外,软件可替代性评分激发了关于企业SaaS架构演变与AI原生竞争者生态的行业分析工作,形成了从职业到企业再到软件产品的完整研究链条。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作