OpenAustralia
收藏OpenAustralia 数据集概述
概览
关键词:澳大利亚民主;议会辩论;政府透明度
OpenAustralia 是一个独立、非党派的网站,致力于使澳大利亚民主更加易于访问和透明。该平台允许公民轻松访问、探索和理解澳大利亚议会的进程。通过提供可搜索的议会辩论(Hansard)记录,用户可以跟踪他们的代表在议会中的言行。
数据来源
原始数据可在 OpenAustralia.org 找到。有关其政策、Hansard 或使用限制的更多详细信息,请从 Help - OpenAustralia 获取信息。
数据结构
在 OpenAustralia 目录下,
-
recent_comments包含 1,117 条 评论,记录时间从 2007 年到 2020 年(最后更新于 2024-08-22)。这些评论来自众议院辩论和参议院辩论。我们同时记录了评论及其主要帖子。
例如,
debate_2014-02-26.92.10.html来自 2014-02-26 的众议院辩论,senate_2020-09-02.187.1.html来自 2020-09-02 的参议院辩论。 -
senate_debates包含 78,915 条 参议院辩论,记录时间从 2006 年到 2024 年(最后更新于 2024-08-22)。每个文件的命名约定为
[date].[id].html。例如,2011-10-12.47.1.html来自 2011-10-12 的参议院辩论,其 ID47.1用于标识其 URL。 -
house_debates包含 116,480 条 众议院辩论,记录时间从 2006 年到 2024 年(最后更新于 2024-08-22)。每个文件的命名约定为
[date].[id].html。例如,2012-03-21.143.1.html来自 2012-03-21 的众议院辩论,其 ID143.1用于标识其 URL。
注意,每个 .html 文件的第一行包含其原始 URL 到 OpenAustralia,例如,<!--https://www.openaustralia.org.au/debate/?id=2017-03-29.89.1-->。
下载
为了从 OpenAustralia 下载资源,我们在 utils 下开发了 Python 脚本,以便您了解我们如何构建 URL,并且您可以修改每个辩论数据库的搜索时间范围。
许可证
本仓库根据 MIT 许可证授权。




