WORKBank

github2025-07-15 更新2025-07-17 收录

下载链接：

https://github.com/SALT-NLP/workbank

下载链接

链接失效反馈

官方服务：

资源简介：

WORKBank（AI Agent Worker Outlook and Readiness Knowledge Bank）是一个数据库，记录了工人对AI代理在职业任务中的期望和技术能力。当前版本的WORKBank包括来自1,500名美国领域工人的偏好和AI专家的能力评估，涵盖了2025年1月至5月期间收集的104个职业中的844项任务。

WORKBank (AI Agent Worker Outlook and Readiness Knowledge Bank) is a database that records the expectations and technical competencies of workers regarding AI agents in professional tasks. The current version of WORKBank includes preferences from 1,500 U.S. field workers and ability assessments from AI experts, covering 844 tasks across 104 professions collected between January and May 2025.

创建时间：

2025-07-12

原始信息汇总

WORKBank数据集概述

数据集简介

名称：WORKBank (AI Agent Worker Outlook and Readiness Knowledge Bank)
目的：记录工人对AI代理在职业任务中的期望以及AI代理的技术能力评估
版本：当前版本包含1,500名美国领域工人的偏好和AI专家的能力评估
覆盖范围：104个职业中的844项任务
数据收集时间：2025年1月至5月

数据内容

工人期望数据：领域工人对AI代理自动化或增强任务的期望
专家评估数据：AI专家对技术能力的评估
任务元数据：任务陈述及相关元数据

数据获取

Hugging Face数据集：https://huggingface.co/datasets/SALT-NLP/WORKBank
下载方式： python from datasets import load_dataset

worker_desire = load_dataset("SALT-NLP/WORKBank", data_files="worker_data/domain_worker_desires.csv")["train"] expert_ratings = load_dataset("SALT-NLP/WORKBank", data_files="expert_ratings/expert_rated_technological_capability.csv")["train"] task_meta_data = load_dataset("SALT-NLP/WORKBank", data_files="task_data/task_statement_with_metadata.csv")["train"]
手动下载：可通过Hugging Face页面直接下载CSV文件

数据分析代码

自动化期望分析：automation_desire.ipynb
自动化可行性分析：automation_viability.ipynb
人类代理水平分析：human_agency_scale.ipynb
人类技能转变分析：human_skill_shift.ipynb

引用

如需使用WORKBank数据库或分析代码，请引用以下论文：

@misc{shao2025futureworkaiagents, title={Future of Work with AI Agents: Auditing Automation and Augmentation Potential across the U.S. Workforce}, author={Yijia Shao and Humishka Zope and Yucheng Jiang and Jiaxin Pei and David Nguyen and Erik Brynjolfsson and Diyi Yang}, year={2025}, eprint={2506.06576}, archivePrefix={arXiv}, primaryClass={cs.CY}, url={https://arxiv.org/abs/2506.06576}, }

搜集汇总

数据集介绍

构建方式

WORKBank数据集通过系统化的跨学科研究方法构建，整合了来自1,500名美国领域工作者的人工标注数据与AI专家技术评估。研究团队采用分层抽样策略覆盖104个职业的844项工作任务，结合定量评分与音频转录分析的多模态数据采集方式，确保数据兼具统计代表性和情境深度。数据采集周期为2025年1月至5月，所有标注流程均通过经伦理审查的标准化协议实施。

特点

该数据集创新性地建立了工作者意愿与技术可行性的双维度评估体系，包含领域工作者对AI代理自动化/增强的偏好评分、专家技术能力评估、任务元数据三大模块。其显著特征在于采用音频增强界面捕获语境化反馈，并实现O*NET职业分类体系与AI可操作性指标的交叉映射。数据覆盖管理、技术、服务等多元职业领域，包含结构化评分与非结构化语音文本的多模态数据形态。

使用方法

研究者可通过Hugging Face平台直接加载标准化数据文件，包括domain_worker_desires.csv（工作者意愿）、expert_rated_technological_capability.csv（专家评估）和task_statement_with_metadata.csv（任务元数据）三个核心组件。配套提供的Jupyter Notebook分析模板支持自动化意愿分布分析、人机协作可行性评估等典型研究场景。对于组织级应用，团队提供定制化审计框架部署方案，支持扩展多模态数据输入和跨文化适应性调整。

背景与挑战

背景概述

WORKBank（AI Agent Worker Outlook and Readiness Knowledge Bank）是由斯坦福大学SALT实验室于2025年推出的创新性数据库，旨在系统评估人工智能代理在职业任务中的自动化与增强潜力。该数据集源于Yijia Shao等人主持的跨学科研究项目，通过整合1500名美国领域工作者对AI代理的偏好数据及专家技术能力评估，覆盖了104种职业中的844项任务。作为首个人工智能与劳动力市场交叉研究的基准数据集，WORKBank为理解AI技术对工作形态的影响提供了量化分析框架，其方法论已发表于计算机与社会交叉领域的顶级预印本平台arXiv。

当前挑战

构建WORKBank面临双重挑战：在领域问题层面，需解决传统劳动力研究难以量化AI技术适用性的难题，特别是如何准确定义任务自动化与增强的技术可行性边界；在数据构建过程中，研究者需克服多模态数据（包括定量评分与音频转录）的标准化处理难题，同时确保跨职业任务评估体系的可比性。当前版本尚存在样本地理分布局限（仅覆盖美国）及新兴职业覆盖不足的挑战，这对研究结论的普适性形成制约。

常用场景

经典使用场景

在人工智能与劳动力市场交叉研究领域，WORKBank数据集为分析AI代理对职业任务的自动化与增强潜力提供了独特视角。该数据集通过整合1500名美国领域工作者偏好与AI专家能力评估，构建了覆盖104个职业844项任务的评估框架，成为研究人机协作动态的基准工具。其多模态数据采集方法尤其适用于探索不同职业背景下工作者对AI技术的接受度差异。

解决学术问题

该数据集有效解决了劳动经济学与AI伦理研究中的关键问题：如何量化评估工作者对AI自动化的真实需求与技术可行性的匹配程度。通过建立欲望-能力二维评估矩阵，研究者能够识别出高需求低能力的任务缺口，为技术研发优先级提供依据。其包含的人口统计学变量更支持了自动化偏好差异的归因分析，填补了传统劳动力调查缺乏技术可行性验证的空白。

衍生相关工作

基于WORKBank的审计方法论，学界已衍生出多个重要研究方向。斯坦福团队开发了人类代理尺度量化模型，用于预测不同自动化水平下的人机权责分配。MIT数字经济倡议则借鉴其框架构建了职业弹性指数，评估AI冲击下的岗位脆弱性。这些工作共同推动了负责任AI部署的理论体系建设，为政策制定者提供了微观决策依据。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集