Orders in Council data

github2024-05-23 更新2024-05-31 收录

下载链接：

https://github.com/lchski/oic-data

下载链接

链接失效反馈

官方服务：

资源简介：

Orders in Council是加拿大法律文本的关键部分，是一种委托立法，为法规或特权提供额外的细节或行使特定的权力。此数据集每日镜像OIC及其附件，以便于大规模研究OIC。

Orders in Council (OIC) constitute a pivotal component of Canadian legal texts, serving as a form of delegated legislation that provides additional details or exercises specific powers for regulations or privileges. This dataset mirrors the OIC and its annexes on a daily basis, facilitating large-scale research on OIC.

创建时间：

2022-07-06

原始信息汇总

加拿大联邦行政命令数据集概述

数据集内容

数据集包含：约62,000个行政命令（OICs）和32,000个附件。
数据量：OICs数据大小为60.3 MB，附件数据大小为131.1 MB。

数据收集方式

自动化更新：通过GitHub Actions每日自动更新数据集。
数据抓取：使用scripts/scrape-order-tables.js和scripts/scrape-attachments.js脚本进行数据抓取。
- scrape-order-tables.js：每日下载新的行政命令摘要表，保存为JSON文件，包含HTML格式的摘要表。
- scrape-attachments.js：下载新的附件，同样采用JSON格式保存。

数据特点

数据不稳定性：数据库中“Dept”列的逗号位置会根据显示顺序变动，导致文件被覆盖，htmlHash更新。
历史数据变更处理：当前工具不处理历史行政命令的变更，但推测这些数据不会变动。

使用建议

直接使用：用户可直接导入数据集进行分析。
分析工具：推荐使用lchski/oic-analysis项目（R语言编写）从原始数据中提取有用信息，进行深入分析。

搜集汇总

数据集介绍

构建方式

该数据集通过自动化脚本每日从加拿大联邦Order in Council数据库中抓取数据，构建而成。具体而言，`scripts/scrape-order-tables.js`脚本利用无头浏览器提交搜索表单，下载新的结果并存储为JSON文件，每个文件包含一个OIC的HTML摘要表。同时，`scripts/scrape-attachments.js`脚本负责下载新的附件，采用类似的JSON存储方式。通过GitHub Actions每日运行这些脚本，确保数据集的持续更新。

特点

该数据集具有显著的规模和多样性，截至2022年7月，包含约62,000个OIC和32,000个附件，总计约191.4 MB。尽管存在一些技术上的小瑕疵，如数据库中“Dept”列的逗号位置变化可能导致文件被覆盖，但整体上数据集的完整性和及时性得到了保障。此外，数据集的构建方式确保了其能够反映加拿大联邦法律文本的最新动态。

使用方法

用户可以直接导入数据集进行分析，或利用`lchski/oic-analysis`项目（使用R语言编写）从原始数据中提取有意义的信息。在使用过程中，建议用户确保数据的来源和准确性，并在可能的情况下，引用或链接到Order in Council Division的官方数据库。通过这种方式，用户可以充分利用该数据集进行深入的法律文本分析和研究。

背景与挑战

背景概述

Orders in Council数据集聚焦于加拿大联邦的法律文本，这些文本作为委托立法的一种形式，为法定或特权提供了额外的细节或行使特定权力。该数据集由一个每日更新的项目支持，旨在镜像Orders in Council及其附件，以解决原始数据库无法导出的问题。自2022年7月起，该数据集包含了约62,000份Orders in Council文件和32,000份附件，总计约191.4 MB的数据量。这一数据集的创建，不仅为大规模研究Orders in Council提供了可能，也填补了相关领域数据获取的空白，对法律研究和社会治理分析具有重要意义。

当前挑战

尽管Orders in Council数据集为研究提供了丰富的资源，但其构建过程中仍面临若干挑战。首先，数据源的动态性导致部分文件因显示顺序变化而重复下载，增加了数据管理的复杂性。其次，数据集目前无法有效处理过往Orders in Council的变更，这限制了对历史数据的持续监控和分析。此外，数据集的自动化更新机制虽已建立，但仍需进一步优化以应对潜在的数据冲突和一致性问题。这些挑战不仅影响数据集的完整性和准确性，也对后续的数据分析和应用提出了更高的技术要求。

常用场景

经典使用场景

在加拿大法律文本研究领域，Orders in Council数据集的经典使用场景主要集中在对委托立法进行系统性分析。研究者们通过该数据集，能够深入探讨OICs在具体权力行使和法规细化中的作用，从而揭示其对加拿大法律体系的影响。此外，该数据集还支持大规模的文本挖掘和自然语言处理，为法律文本的自动化分析提供了坚实基础。

解决学术问题

Orders in Council数据集解决了法律研究中对委托立法进行大规模、系统性分析的难题。传统上，研究者们难以获取和处理如此大量的法律文本数据，而该数据集通过每日更新和结构化存储，使得这一过程变得可行。这不仅推动了法律文本分析技术的发展，还为政策制定和法律实践提供了宝贵的数据支持。

衍生相关工作

基于Orders in Council数据集，衍生了一系列相关的经典工作。例如，`lchski/oic-analysis`项目利用R语言对原始数据进行深入分析，提取有意义的信息，进一步推动了法律文本分析的研究。此外，该数据集还激发了多个研究项目，探讨如何利用机器学习和自然语言处理技术，提高法律文本分析的效率和准确性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集