five

Company-Year Workforce Intelligence (1950 - 2020)

收藏
Snowflake2026-04-15 更新2026-04-16 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZU8Z8FFIE
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset provides longitudinal workforce intelligence at the company-year level, capturing how organizations grow, contract, and evolve over time. Built on a structured company-year model, it enables multi-year tracking across millions of companies and supports analytical workflows, investment research, and AI-driven use cases. The dataset spans 1950 to 2020, with the highest coverage density in the 2015-2020 period. The sample tables included cover the 2018-2020 window. Core attributes include company identifiers, workforce size (headcount), growth rates, role composition, skill distributions, capability domains, industry classification, company size segments, and geographic data. Delivered in analytics-ready format, the dataset can be directly queried within Snowflake and integrated into modern data pipelines.
提供机构:
Vivameda
创建时间:
2026-03-24
原始信息汇总

Company-Year Workforce Intelligence (1950 - 2020) 数据集概述

基本信息

  • 数据集名称: Company-Year Workforce Intelligence (1950 - 2020)
  • 提供商: Vivameda
  • 获取方式: 免费试用 (Trial: Available)
  • 数据格式: 分析就绪格式,可直接在 Snowflake 中查询并集成到现代数据管道中。

数据内容与范围

  • 核心描述: 该数据集提供公司-年份层面的纵向劳动力情报,捕捉组织如何随时间增长、收缩和演变。
  • 数据模型: 基于结构化的公司-年份模型。
  • 时间范围: 1950年至2020年,其中2015-2020年期间覆盖密度最高。包含的示例表涵盖2018-2020年窗口。
  • 数据规模: 涵盖420万家公司,4800万条观测记录。
  • 核心属性:
    • 公司标识符
    • 劳动力规模(员工人数)
    • 增长率
    • 角色构成
    • 技能分布
    • 能力领域
    • 行业分类
    • 公司规模细分
    • 地理数据

业务需求与应用场景

机器学习

  • 作为机器学习模型的结构化公司-年份训练数据,用于理解公司演变。
  • 涵盖劳动力增长轨迹、角色构成转变、技能转换和能力变化。
  • 提供带有前向结果列的预计算信号,用于监督学习。
  • 设计为预测公司健康状况、增长模式和组织转型的模型特征层。

市场分析

  • 分析420万家公司跨越70年历史的劳动力增长趋势、行业动态和公司演变模式。
  • 比较行业表现,跟踪公司轨迹,并在公司-年份层面识别员工人数、角色构成和组织能力的结构性转变。

数据字典(示例表列)

  • company_id (Varchar)
  • company_name (Varchar)
  • industry (Varchar)
  • country (Varchar)
  • company_size_raw (Varchar)
  • year (Number)
  • headcount_observed (Number)
  • net_headcount_change (Number)
  • growth_rate_yoy (Number)
  • avg_tenure_years (Number)
  • growth_bucket (Varchar)
  • primary_role_bucket (Varchar)
  • primary_role_pct (Number)
  • distinct_role_buckets (Number)
  • role_diversity_bucket (Varchar)

使用示例

按年份计算的平均劳动力增长率 (2010-2020)

  • 显示整个公司群体十年间劳动力增长的长期减速。适用于宏观趋势分析和状态检测。
  • 提供了示例SQL查询代码。

分类

  • AI & ML
  • Machine Learning
  • Market Analysis

技术支持与文档

  • 销售联系: oli@vivameda.com
  • 支持联系: data@vivameda.com
  • 文档: 提供文档链接。
  • 数据刷新: 静态数据产品。
  • 时间覆盖: 1950年1月1日 - 2021年1月1日(按年)。
  • 地理覆盖: 全球(按国家)。
  • 云区域可用性: 在AWS的多个区域可用,包括非洲(开普敦)、亚太(雅加达)、亚太(马来西亚)、亚太(孟买)等。

法律条款

  • Standard

关于提供商 Vivameda

Vivameda 是一家数据基础设施公司,致力于从大规模专业和公司记录中开发结构化的劳动力情报数据集。该平台将数亿条记录转化为规范化的公司级数据集,这些数据集以公司-年份观测值的形式组织,捕捉劳动力规模、增长模式、角色分布、行业分类和地理属性。这些数据集专为需要结构化公司情报以进行市场分析、劳动力研究和机器学习应用的分析师、研究团队和AI开发人员设计。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作