five

hse-regulators-directory

收藏
Hugging Face2026-05-13 更新2026-05-15 收录
下载链接:
https://huggingface.co/datasets/SmartQHSE/hse-regulators-directory
下载链接
链接失效反馈
官方服务:
资源简介:
HSE 监管机构目录是一个结构化的参考数据集,旨在收录全球主要的职业安全与健康(HSE/EHS)监管机构信息。该数据集覆盖 27 个司法管辖区,共包含 36 个关键监管机构,地域范围涵盖北美(如美国 OSHA、NIOSH、MSHA,加拿大 CCOHS)、欧洲(如英国 HSE、欧盟 EU-OSHA、法国 INRS、德国 BAuA)、海湾合作委员会国家(如阿联酋、沙特阿拉伯、卡塔尔)、亚太地区(如澳大利亚、新西兰、日本、韩国、新加坡、印度)、非洲及拉丁美洲(如南非、巴西、墨西哥)以及国际组织(如 ILO、ISO、IOGP)。每个数据条目提供了监管机构的标准化信息,包括:所属国家/地区(附带 ISO 3166-1 alpha-2 代码)、监管机构全称、官方缩写、官方网站链接、上级主管机构、核心管辖法规(法案、条例、规范、公约)、适用范围(国家层面、特定行业或国际性)、成立年份,以及对应的 Wikidata 实体标识符(Q-ID,若存在)。该数据集适用于文本检索、信息提取、表格分类、知识图谱构建以及合规性研究与分析等任务,为 HSE 领域的从业者、研究者和开发者提供权威的机构参考信息。数据集由 SmartQHSE 创建并维护,采用 CC BY 4.0 许可协议发布。

The HSE Regulatory Agency Directory is a structured reference dataset designed to compile information on major occupational safety and health (HSE/EHS) regulatory agencies worldwide. It covers 27 jurisdictions, including 36 key regulatory agencies, with a geographical scope encompassing North America (e.g., US OSHA, NIOSH, MSHA, Canada CCOHS), Europe (e.g., UK HSE, EU EU-OSHA, France INRS, Germany BAuA), Gulf Cooperation Council countries (e.g., UAE, Saudi Arabia, Qatar), Asia-Pacific (e.g., Australia, New Zealand, Japan, South Korea, Singapore, India), Africa and Latin America (e.g., South Africa, Brazil, Mexico), and international organizations (e.g., ILO, ISO, IOGP). Each data entry provides standardized information on regulatory agencies, including: country/region (with ISO 3166-1 alpha-2 code), full name of the agency, official abbreviation, official website link, superior authority, core regulatory laws (acts, regulations, standards, conventions), scope of application (national level, specific industries, or international), year of establishment, and corresponding Wikidata entity identifier (Q-ID, if available). The dataset is suitable for tasks such as text retrieval, information extraction, table classification, knowledge graph construction, and compliance research and analysis, providing authoritative institutional reference information for HSE practitioners, researchers, and developers. It is created and maintained by SmartQHSE and released under the CC BY 4.0 license.
创建时间:
2026-05-09
搜集汇总
数据集介绍
main_image_url
构建方式
在全球职业安全与健康(OSH)治理体系中,监管机构的权威性与协调性至关重要。基于此背景,HSE Regulators Directory收录了涵盖北美、欧洲、海湾合作委员会、亚太、非洲及拉丁美洲等27个司法管辖区的36个主要职业安全与健康监管机构。每个条目包含国家/地区及其ISO 3166-1二位字母代码、监管机构全称、简称、官方网站、上级机构、关键立法(包括法案、条例、规程与公约)、监管范围(国家/行业/国际)、成立年份及维基数据Q-ID。数据集通过人工整理与权威来源交叉验证构建,确保信息完备。
特点
该数据集具有高度结构化与跨区域覆盖两大显著特征。其一,每个条目均配备统一字段与标准编码,便于机器读取与本地化检索,且部分机构关联维基数据实体,支持语义查询与知识图谱链接。其二,数据集不仅覆盖OSHA、HSE、EU-OSHA等全球知名机构,还纳入UAE、KSA、SG等新兴经济体监管实体,实现了从北美洲至大洋洲的广泛地理跨度。所有条目均基于CC-BY 4.0许可证发布,保障了开放性与可复用性。
使用方法
使用者可通过Hugging Face Datasets库便捷加载该目录,示例代码为:from datasets import load_dataset; ds = load_dataset(\"SmartQHSE/hse-regulators-directory\")。遍历训练集即可获取每条记录的简称、国家与监管机构全称。此外,该数据集支持针对维基数据非空条目的命令行过滤,例如通过curl与jq结合提取具有Q-ID的机构信息。作为SmartQHSE开放HSE数据计划的一部分,该数据集可与同系列法规变更日志、术语表等协同使用,适用于合规分析、咨询参考及AI模型训练等场景。
背景与挑战
背景概述
在全球职业安全与健康(HSE)领域,监管机构的多样性与司法管辖权的复杂性构成了信息整合的重大障碍。为应对这一挑战,SmartQHSE Ltd于2026年推出了HSE Regulators Directory数据集,系统收录了涵盖北美、欧洲、海湾合作委员会、亚太、非洲及拉丁美洲等27个司法管辖区的36个主要职业安全与健康监管机构。每项记录均包含监管机构的全称、缩写、官方网站、上级机构、关键立法、管辖范围、成立年份及维基数据标识符。该数据集为跨区域合规研究、监管比较分析及人工智能驱动的HSE知识系统提供了标准化、可机器读取的权威参考,填补了该领域结构化公共数据资源的空白。
当前挑战
该数据集着力解决的核心领域挑战在于:全球职业安全与健康监管体系碎片化导致的信息不对称问题,使得跨国企业、研究机构及合规系统难以高效获取并整合来自不同司法管辖区的监管机构信息。构建过程中的关键挑战包括:多语言与异构数据源的归一化处理,不同国家监管机构的命名惯例与层级结构差异;确保关键立法信息的准确性与时效性,需持续跟踪各国法规变动;以及从维基数据等公开知识图谱中可靠提取并匹配实体标识,以增强数据集的可链接性与互操作性,这要求对各司法管辖区立法框架有深入的专业理解。
常用场景
经典使用场景
在职业安全与健康(OSH)领域,监管机构的准确识别与跨地域对比是学术研究与合规管理的基石。该数据集作为一份精心编纂的权威参考名录,收纳了涵盖北美、欧洲、海湾合作委员会、亚太、非洲及拉丁美洲等27个司法管辖区的36个主要职业安全与健康监管机构。每个条目不仅提供机构全称、缩写与官方网站,更附有ISO国家代码、关键立法、监管范围与成立年份等结构化元数据,为跨区域政策比较、监管体系演化分析以及知识图谱构建提供了标准化的数据蓝本。
实际应用
在跨国企业与合规科技领域,该数据集发挥着不可或缺的导航作用。跨国公司可利用其索引迅速定位各运营地的法定监管主体与适用法规,优化合规管理体系;风险管理软件开发者可将其集成至自动化合规引擎,实现监管变更的实时追踪与预警。此外,该数据与Wikidata的交叉引用使其能嵌入语义网生态,支撑智能合约中监管义务的自动匹配,或通过RAG(检索增强生成)系统为法律顾问提供精准的管辖指引,显著降低复杂地域的合规成本。
衍生相关工作
该数据集作为SmartQHSE开放数据计划的基石,催生了一系列配套资源,共同构成HSE监管领域的协同知识体系。衍生工作包括记录25+司法管辖区法规演进的《hse-regulations-changelog》、提供130余条权威术语定义的《hse-glossary》,以及融合35+重大过程安全事件的《major-process-safety-incidents-2026》。这些数据集与监管机构名录形成多维互联,支持从监管实体到条文变更再到事故根源的全链条分析,为构建端到端的职业安全智能决策系统奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作