hse-incident-rate-formulas
收藏Hugging Face2026-05-13 更新2026-05-14 收录
下载链接:
https://huggingface.co/datasets/SmartQHSE/hse-incident-rate-formulas
下载链接
链接失效反馈官方服务:
资源简介:
HSE事故率公式参考数据集是一个结构化的参考数据集,收录了全球职业健康安全(HSE/EHS)领域广泛使用的7种标准事故率计算公式。这些核心指标包括:TRIR(总可记录事故率)、LTIFR(损失工时伤害频率率)、DART(缺勤、受限或调岗事故率)、AFR(事故频率率)、Severity Rate(严重率)、TRIFR(总可记录伤害频率率)和LTIR(损失工时事故率)。数据集详细提供了每个指标的精确计算公式、标准乘数(如200,000或1,000,000)及其含义、计算所需的输入变量、输出结果的单位,以及对应的权威管理机构(如美国OSHA、国际劳工组织ILO、英国HSE等)和适用司法管辖区。此外,每个条目还包含一个实际计算示例、相关的行业基准数据(如BLS SOII、UK HSE、IOGP等)的参考,并交叉链接到对应的在线计算器页面。该数据集旨在为HSE专业人员、数据分析师、研究人员和软件开发者提供一个准确、权威的公式参考源,适用于安全绩效指标计算、基准比对、报告自动化、教育培训以及相关AI模型(如检索增强生成)的知识库构建等场景。数据集规模较小,以结构化的JSONL格式提供,便于程序化访问和集成。
创建时间:
2026-05-09
原始信息汇总
数据集概述:HSE Incident Rate Formulas Reference
该数据集是一个专注于全球职业安全健康(HSE)领域7种标准事故率计算公式的参考数据集。
核心内容
数据集收录了以下7个关键安全指标及其完整信息:
- TRIR — OSHA总可记录事故率
- LTIFR — 损失工时工伤频率(ILO/UK HSE标准)
- DART — 缺勤、受限或转岗率
- AFR — 事故频率(UK HSE标准)
- Severity Rate — 严重率/百万工时损失天数
- TRIFR — 总可记录工伤频率(澳大利亚/新西兰/IOGP标准)
- LTIR — 损失工时事故率(OSHA基准)
每条记录的条目内容
- 精确的计算公式
- 乘数(如200,000或1,000,000)及其含义
- 所需的输入参数
- 输出单位
- 权威来源及其URL
- 计算示例
- 适用的行业基准(如BLS SOII、UK HSE、IOGP等)
- 指向SmartQHSE计算器的交叉链接
数据集属性
- 许可协议: CC-BY-4.0
- 语言: 英语
- 规模: 样本数量 < 1K
- 任务类型: 表格分类、文本检索
- 标签: HSE / EHS / 职业安全 / OSHA / TRIR / LTIFR / DART / AFR / 严重率 / 安全指标 / 参考
相关配套资源
- 交互式计算器空间: SmartQHSE/hse-incident-rate-calculator
- 基准数据集: SmartQHSE/hse-benchmarks-2026
- OSHA费率数据集: SmartQHSE/osha-rates-2026
- 术语表: SmartQHSE/hse-glossary
- 完整数据集合集: SmartQHSE Open HSE Data
数据获取方式
- Python: 使用
load_dataset("SmartQHSE/hse-incident-rate-formulas") - 直接下载: 通过
curl获取data.jsonl文件
引文与授权
- 引用格式: SmartQHSE Ltd (2026). HSE Incident Rate Formulas Reference [dataset].
- 许可协议: CC BY 4.0
- 构建方: SmartQHSE
相关Wikidata条目
- HSE Benchmarks 2026 — Q139532316
- OSHA Recordable Rates 2026 — Q139623110
- HSE Glossary — Q139623112
- ARIA (HSE AI助手) — Q139714237
SmartQHSE相关数据集一览
该数据集属于SmartQHSE开放HSE数据集合,该集合还包括:
hse-benchmarks-2026(跨国家/行业基准)osha-rates-2026(美国OSHA费率)hse-qa-corpus(长篇幅HSE问答对)hse-glossary(130+权威术语定义)hse-regulations-changelog(25+司法辖区监管更新)major-process-safety-incidents-2026(重大工艺安全事故参考)hse-instruction-tuning(HSE指令微调数据对)hse-regulators-directory(40+国家劳动机构目录)hse-standards-crosswalk(ISO 45001 ↔ OSHA等标准映射)gcc-heat-illness-regulations-2026(海湾国家夏季禁令规则)osha-most-cited-standards-2024(OSHA被引用最多的30个标准)osha-regulated-chemicals-pel-2026(OSHA受控化学品PEL数据)named-process-safety-incidents-extended-2026(1911–2024年43起事故扩展参考)hse-acronym-dictionary-2026(150+ HSE缩写词词典)
所有数据集均采用CC BY 4.0许可协议。
搜集汇总
数据集介绍

构建方式
在职业安全与健康领域,精确的事故率计算是风险评估与合规管理的基石。该数据集系统整合了全球通用的7项核心职业安全事件率公式,涵盖TRIR、LTIFR、DART、AFR、Severity Rate、TRIFR及LTIR。每一项条目均包含完整的数学表达式、乘数含义解析、所需输入变量、输出单位、权威来源及其URL链接、详尽的运算示例,以及适用的行业基准参考(如BLS SOII、UK HSE、IOGP等),并交叉链接至SmartQHSE对应的在线计算工具页面。数据以JSONL格式存储,结构清晰,便于检索与程序化调用。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,以Python代码`load_dataset("SmartQHSE/hse-incident-rate-formulas")`即可获取训练集,并遍历每条记录中的公式名称与具体表达式。同时,亦支持直接通过curl命令以JSONL格式获取原始数据,便于集成至自定义分析管线或知识库。作为SmartQHSE开放数据计划的一部分,该数据集指导用户在实践中可将计算出的指标与配套的`hse-benchmarks-2026`等行业基准数据集进行比对,从而有效评估与改善组织的职业安全绩效。
背景与挑战
背景概述
在职业安全与健康(HSE)领域,全球各地采用着多种事故率计算标准,如美国的TRIR、国际劳工组织的LTIFR等,这些指标虽广泛应用,却因计算方式、乘数和管辖范围的差异,常导致跨国企业与研究机构在数据对比与分析时出现混淆。为应对这一挑战,SmartQHSE公司于2026年发布了HSE Incident Rate Formulas Reference数据集,系统收录了七项主流标准事故率公式,每项均包含精确计算式、乘数含义、输入参数、输出单位、权威来源及实例演示。该数据集由SmartQHSE团队构建,旨在为全球HSE从业者、标准制定者及灾害风险分析研究者提供统一、可信的参考基准。作为SmartQHSE开放数据计划的核心组成部分,该数据集已关联维基数据条目,并与HSE基准数据集、OSHA历史数据等形成协同知识体系,显著推动了职业安全领域数据标准化与跨区域比较研究的进展。
当前挑战
该数据集所解决的核心领域问题在于,全球职业安全指标的计算标准纷繁复杂,企业跨区域运营时难以统一评估安全绩效,而现有文献或官方指南通常分散于各国法规与机构文档中,缺乏集中化、可机器读取的对照资源。通过将七种核心公式以结构化格式整理并开放,该数据集有效填补了这一空白,为自动化合规审核、跨行业基准校核及安全模型训练提供了数据基础。在构建过程中,团队面临的主要挑战包括:确保每一项公式的乘数来源与权威机构定义严格匹配,消除不同版本标准间的细微偏差;需同时涵盖计算参数与行业基准(如BLS SOII、IOGP数据)的交叉验证,防止孤立公式导致误读;此外,数据集还需保持与SmartQHSE生态中其它实时更新资源(如法规变更日志、行业基准2026)的同步与兼容,这对版本控制与元数据管理提出了较高要求。
常用场景
经典使用场景
在职业安全与健康领域,hse-incident-rate-formulas数据集作为一套标准化的伤害率计算公式参考,被广泛应用于全球不同司法管辖区的事故统计与安全绩效评估中。研究人员和从业人员可利用该数据集精确获取TRIR、LTIFR、DART、AFR等七项核心指标的数学定义、乘数因子、输入变量及输出单位,从而在跨国或多行业的安全对标分析中确保计算口径的一致性。无论是学术论文中的事故率建模,还是企业内部的安全审计报告,该数据集均能提供权威且可追溯的公式来源,成为连接基础安全统计与高级数据分析的桥梁。
解决学术问题
该数据集有效解决了职业伤害率研究中长期存在的公式定义模糊与区域标准冲突问题。长期以来,学术工作者在进行跨国比较或跨行业损伤频率分析时,常因OSHA、ILO及UK HSE等机构采用不同的计算乘数(200,000与1,000,000)而陷入混乱。本数据集通过系统整理七种标准公式及其权威出处,并附带有详尽的工作示例和行业基准链接,为厘清统计口径差异提供了结构化参考。这一工作显著提升了事故率研究的可复现性与跨研究可比性,奠定了安全科学计量分析的数据基础,推动职业流行病学与风险管理领域的量化研究迈向更严谨的标准化阶段。
实际应用
在实际工业场景中,该数据集被广泛嵌入企业安全管理信息系统与第三方合规平台,助力EHS工程师快速计算年度工伤率以响应监管报告要求。例如,跨国制造商可根据数据集中的LTIFR和TRIFR公式,统一其全球工厂的伤害频率统计规则,以便向不同地区的监管机构(如OSHA与Safe Work Australia)提交一致且合规的报表。此外,数据集内建的行业基准链接使安全管理者能够将本企业的事故率与BLS、UK HSE或IOGP的参考值进行实时对标,从而精准识别高风险领域并针对性地优化安全投入策略,将数据洞察转化为切实的预防行动。
数据集最近研究
最新研究方向
在全球职业安全与健康(HSE)领域,随着跨区域监管合规要求的日益复杂与精准化,该数据集作为全球7项核心事故率指标(如TRIR、LTIFR、DART等)的标准化参考基准,正与智能计算器、行业基准及法规变更日志等关联工具链深度整合,推动形成一套可溯源、可互操作的开放数据生态。前沿研究方向聚焦于利用该结构化公式库进行自动化合规审计、多司法管辖区指标对比分析,以及基于真实世界基准数据(如BLS SOII、UK HSE)的预测性安全态势评估。其作为RAG和指令微调语料的关键组件,正赋能面向安全人员的AI助手(如ARIA)实现精准的公式查询与案例推导,标志着HSE数据治理从孤立的制度文本向可计算、可推理的知识图谱演进,显著提升了跨组织安全绩效对标与风险预警的时效性与可靠性。
以上内容由遇见数据集搜集并总结生成



