World-Layoffs-Dataset

github2024-09-11 更新2024-09-12 收录

下载链接：

https://github.com/RAAD07/SQL_Project_World-Layoffs-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了全球裁员的相关数据，包括公司、地点、行业、裁员总数、裁员百分比、日期、阶段、国家以及筹集的资金等信息。

This dataset contains relevant data on global layoffs, including information such as companies, locations, industries, total number of layoffs, layoff percentage, dates, stages, countries, and raised funds.

创建时间：

2024-09-11

原始信息汇总

SQL_Project_World-Layoffs-Dataset

数据集概述

该数据集包含全球裁员数据，主要用于SQL项目中的数据清洗和探索性数据分析（EDA）。

数据清洗

数据清洗部分主要包括以下步骤：

去除重复数据：通过创建新表并使用ROW_NUMBER()函数标记重复行，然后删除重复行。
标准化数据：对公司名称、地点、国家和行业名称进行标准化处理，去除多余空格，并统一相关行业的命名。
处理空值和缺失值：检查并填充缺失的行业数据，删除在total_laid_off、percentage_laid_off和funds_raised_millions列中同时缺失的行。
删除无用行和列：删除不再需要的row_num列。

探索性数据分析（EDA）

EDA部分主要包括以下分析：

最大裁员人数和百分比：查找最大裁员人数和百分比。
完全裁员的公司：查找完全裁员的公司并统计数量。
裁员最多的公司和行业：按公司和行业汇总裁员人数，找出裁员最多的公司和行业。
裁员时间分析：分析裁员的时间范围、年度和月份分布。
按国家分析裁员：按国家汇总裁员人数，找出裁员最多的国家。
公司阶段分析：分析不同公司阶段（如早期、中期、后期）的裁员情况。
资金分析：分析公司筹集的资金情况，找出筹集资金最多的公司、行业和国家。

数据集结构

数据集包含以下字段：

company：公司名称
location：公司所在地
industry：行业
total_laid_off：裁员总数
percentage_laid_off：裁员百分比
date：裁员日期
stage：公司发展阶段
country：国家
funds_raised_millions：筹集资金（百万美元）

数据集用途

该数据集适用于进行数据清洗、探索性数据分析和SQL查询练习，尤其适用于分析全球裁员趋势和公司资金情况。

搜集汇总

数据集介绍

构建方式

在构建World-Layoffs-Dataset时，首先进行了数据清洗，包括去除重复记录、标准化数据格式、处理缺失值以及删除不必要的行和列。通过创建多个工作表来保护原始数据，并使用SQL语句进行数据操作，如使用ROW_NUMBER()函数识别和删除重复记录，通过TRIM()函数标准化公司名称、地点、国家和行业名称，以及使用STR_TO_DATE()函数将日期格式化。此外，通过JOIN操作填充缺失的行业数据，并最终删除不再需要的辅助列。

特点

World-Layoffs-Dataset的特点在于其高度清洗和标准化的数据，确保了数据的准确性和一致性。数据集包含了全球范围内的裁员信息，涵盖公司名称、地点、行业、裁员总数、裁员百分比、日期、公司阶段、国家以及筹集资金等详细信息。这些数据经过精细处理，使得研究者能够进行深入的探索性数据分析，揭示裁员趋势和模式。

使用方法

使用World-Layoffs-Dataset时，研究者可以通过SQL查询进行数据检索和分析，探索不同公司、行业和国家在不同时间段的裁员情况。数据集支持多种分析任务，如计算最大裁员总数和百分比、识别裁员最多的公司和行业、分析裁员的时间分布等。此外，数据集还提供了按年份和月份的裁员汇总，便于进行时间序列分析和趋势预测。

背景与挑战

背景概述

在全球经济波动与技术革新的背景下，企业裁员现象日益受到关注。World-Layoffs-Dataset数据集应运而生，旨在提供一个全面的企业裁员数据资源，以支持相关领域的研究与分析。该数据集由匿名研究人员或机构创建，时间不详，但其核心研究问题聚焦于全球范围内的企业裁员情况，包括裁员数量、裁员比例、公司阶段、所在国家及行业等信息。这一数据集的推出，为研究企业裁员趋势、经济影响及政策制定提供了宝贵的数据支持。

当前挑战

World-Layoffs-Dataset在构建过程中面临多项挑战。首先，数据清洗过程中需处理重复记录、标准化数据格式、填补缺失值及删除无用列，确保数据质量。其次，数据集需涵盖全球多个国家和行业的裁员信息，确保数据的全面性和代表性。此外，数据集还需应对不同国家、行业及公司阶段的裁员数据差异，确保分析结果的准确性和可靠性。这些挑战不仅考验数据处理技术，也要求研究者具备跨领域的知识背景。

常用场景

经典使用场景

在全球经济波动与企业战略调整的背景下，World-Layoffs-Dataset数据集成为分析企业裁员趋势的重要工具。该数据集通过详细记录各公司、行业、国家及地区的裁员情况，为研究者提供了丰富的数据资源。经典使用场景包括：分析特定行业或国家在经济周期中的裁员模式，识别裁员高峰期与低谷期，以及评估不同经济环境下企业应对策略的有效性。

解决学术问题

World-Layoffs-Dataset数据集在学术研究中解决了多个关键问题。首先，它为经济学者提供了实证数据，用以研究宏观经济政策对企业裁员决策的影响。其次，社会学家可以利用该数据集探讨裁员对社会结构和劳动力市场的长期影响。此外，该数据集还支持心理学研究，分析裁员事件对员工心理健康的即时与延迟效应。这些研究不仅深化了对裁员现象的理解，也为政策制定者提供了科学依据。

衍生相关工作

基于World-Layoffs-Dataset数据集，研究者们开展了多项衍生工作。例如，有学者利用该数据集构建了裁员预测模型，通过机器学习算法预测未来裁员的可能性，为企业和政府提供预警。此外，还有研究聚焦于裁员对员工心理健康的影响，开发了心理干预模型，旨在帮助受裁员影响的员工尽快恢复心理平衡。这些衍生工作不仅丰富了数据集的应用场景，也为相关领域的研究提供了新的视角和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集