osha-rates-2026
收藏Hugging Face2026-05-13 更新2026-05-15 收录
下载链接:
https://huggingface.co/datasets/SmartQHSE/osha-rates-2026
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为US OSHA Recordable Rates by Industry 2026,提供了美国私营行业按北美行业分类系统(NAICS)代码分类的职业安全与健康管理局(OSHA)可记录率指标。数据内容包括总可记录伤害率(TRIR)、缺勤、限制或调职案例率(DART)、缺勤率、与平均百分比对比、致命伤害率以及各行业的主要致命事件。数据集规模较小(样本数少于1000),以表格形式呈现,每行代表一个行业或维度,并附带完整的元数据和指标定义。数据来源权威,主要基于美国劳工统计局(BLS)的2024年职业伤害与疾病调查(SOII)、2024年致命职业伤害普查(CFOI)以及OSHA伤害跟踪应用(ITA)2024年提交数据,同时整合了英国健康与安全执行局(HSE)、国际油气生产者协会(IOGP)、国际劳工组织(ILO)和欧洲职业安全与健康局(EU-OSHA)等国际机构的统计数据。数据集旨在为健康、安全与环境(HSE)领域提供免费的开放数据资源,支持职业安全分析、行业基准比较、风险评估和机器学习任务(如表格分类和文本检索)。数据集每年更新,提供静态CSV/JSON文件和可过滤的REST API访问,采用CC BY 4.0许可证,允许商业使用并需署名。
The dataset is named US OSHA Recordable Rates by Industry 2026 and provides Occupational Safety and Health Administration (OSHA) recordable rate metrics for U.S. private industries classified by North American Industry Classification System (NAICS) codes. The data includes total recordable injury rate (TRIR), days away, restricted, or transferred case rate (DART), absence rate, comparison with average percentages, fatal injury rate, and major fatal incidents by industry. The dataset is small in scale (with fewer than 1000 samples), presented in tabular format where each row represents an industry or dimension, accompanied by complete metadata and metric definitions. The data sources are authoritative, primarily based on the U.S. Bureau of Labor Statistics (BLS) 2024 Survey of Occupational Injuries and Illnesses (SOII), 2024 Census of Fatal Occupational Injuries (CFOI), and OSHA Injury Tracking Application (ITA) 2024 submission data, while also integrating statistics from international agencies such as the UK Health and Safety Executive (HSE), International Association of Oil & Gas Producers (IOGP), International Labour Organization (ILO), and European Agency for Safety and Health at Work (EU-OSHA). The dataset aims to provide free open data resources for the health, safety, and environment (HSE) field, supporting occupational safety analysis, industry benchmarking, risk assessment, and machine learning tasks (such as table classification and text retrieval). The dataset is updated annually, offering static CSV/JSON files and filterable REST API access, and is licensed under CC BY 4.0, permitting commercial use with attribution required.
创建时间:
2026-05-03
搜集汇总
数据集介绍

构建方式
该数据集由SmartQHSE Ltd于2026年发布,整合了美国劳工统计局(BLS)2024年职业伤害与疾病调查(SOII)及致命职业伤害普查(CFOI)数据,并纳入OSHA伤害追踪应用程序(ITA)2024年提交记录。数据以美国私营工业的NAICS代码为维度,系统收录了总可记录伤害率(TRIR)、转移或限制工作天数率(DART)、缺勤天数率、与平均值偏差百分比、致命伤害率及主要致命事件等关键指标。数据集提供CSV和JSON两种格式,其中JSON格式包含完整的元数据块与指标定义,便于用户直接解析使用。
特点
本数据集的核心特色在于其权威性与时效性,所有指标均源自美国联邦政府官方统计机构的最新年度数据。它不仅涵盖了美国私营工业各NAICS行业的标准化可记录伤害率,还创新性地加入了致命伤害率及其主要事件类型,形成了全面的行业安全画像。此外,数据集附带了一份详尽的数据源清单,囊括了BLS、OSHA、HSE、IOGP、ILO及EU-OSHA等多个国际权威机构的统计数据,为跨行业、跨国别的安全绩效对比提供了坚实的基础。
使用方法
用户可通过多种便捷途径获取该数据集:直接访问SmartQHSE官网的规范化页面进行浏览,或通过静态JSON/CSV链接批量下载完整数据。对于需要动态筛选的场景,SmartQHSE提供了无需认证、无速率限制的REST API接口,支持按行业维度进行实时查询。数据集采用CC BY 4.0许可协议,允许商业用途,仅需在引用时标注SmartQHSE Ltd为数据来源。该资源特别适用于工业安全研究人员、企业EHS管理人员以及保险精算师进行行业基准对比和风险建模分析。
背景与挑战
背景概述
在职业安全与健康领域,系统化且公开可得的行业级事故率数据是开展基准分析、风险预警及政策制定的重要基石。2026年,SmartQHSE Ltd依托美国劳工统计局(BLS)下属的职业伤害与疾病调查(SOII)、致命职业伤害普查(CFOI)以及美国职业安全与健康管理局(OSHA)的伤害追踪应用(ITA)2024年提交数据,整合发布了“美国OSHA行业可记录伤害率2026”数据集。该数据集覆盖了按北美产业分类系统(NAICS)代码划分的私营行业核心指标,包括总可记录伤害率(TRIR)、转移或受限工作日案例率(DART)、缺勤天数率、致命伤害率及主要致命事件类型。其核心研究问题在于打破传统安全统计数据的获取壁垒,通过CC BY 4.0许可协议提供开源、结构化的行业级事故率数据,为安全工程师、数据分析师及学术研究者构建可复现的循证安全模型提供权威数据支撑。该数据集的影响力尤为深远,它首次将原本分散于多个政府年度报告中的关键指标融合为单一机器可读表格,极大促进了跨行业安全绩效的纵向比较与横向分析。
当前挑战
该数据集所应对的领域核心挑战在于,长期以来职业安全与健康管理常因缺乏标准化、可比性的行业参照数据,而陷入被动响应和主观判断的困境。企业及监管机构难以在统一框架下精准定位自身安全绩效的短板,从而阻碍了基于风险的预防策略与数据驱动决策的普及。在数据集构建层面,挑战主要体现在三个方面:首先,原始数据来源多元,需从BLS、OSHA等不同机构的不同报告格式中提取、清洗并统一字段定义,确保跨源数据的一致性;其次,行业分类体系(NAICS)的粒度与时效性差异要求对数据进进行精细对齐,以维持统计口径的严谨性;最后,数据集需每年同步更新(以BLS SOII年度发布时间为准),维护长期连贯性和历史可对比性,这对数据管道和版本管理提出了持续挑战。
常用场景
经典使用场景
在职业安全与健康研究领域,OSHA Rates 2026数据集为行业伤害率的量化分析提供了权威基准。该数据集整合了美国劳工统计局SOII与CFOI调查以及OSHA ITA提交数据,按NAICS行业代码精细呈现TRIR、DART、工伤休假天数率、致死率及主要致命事件等核心指标。研究者常将其用于跨行业安全绩效对比,例如识别高风险制造业与低伤害服务业的特征差异,或建立行业特定的伤害率预测模型。数据的时间跨度和来源权威性使其成为纵向趋势分析的理想素材,尤其适合评估职业安全法规调整或技术进步对工伤率的影响。
实际应用
在实际安全治理中,该数据集已成为企业EHS部门制定安全生产策略的核心决策工具。安全管理人员可通过对比本企业TRIR与对应NAICS行业均值,精准定位安全短板所在行业区间,进而将有限资源优先投入风险最高的工作领域。保险公司与风险评估机构亦可借助这些公开基准优化保费定价模型,为事故预防提供经济杠杆。此外,职业安全咨询公司运用行业伤害率为客户定制标杆管理方案,帮助制造、油气、建筑等重工业机构将安全表现从合规达标提升至行业领先水平。
衍生相关工作
该数据集的开放发布催生了横向多源对比研究的涌现。研究者将其与SmartQHSE系列中《跨国行业安全基准2026》数据集结合,实现了中美欧15国20余行业的伤害率跨域对标,突破了单一国别数据的视野局限。另一经典衍生方向是将TRIR、DART等结构化指标与《HSE问答语料库》等非结构化文本进行多模态融合,训练出能同时解析数值规律与法规语义的专业安全大语言模型。此外,数据驱动的安全预警系统开发也得益于此——部分学者利用该数据集构建行业伤害率异常检测框架,实现工业事故高峰期的提前预警。
以上内容由遇见数据集搜集并总结生成



