five

open-congress-data

收藏
github2025-10-01 更新2025-10-03 收录
下载链接:
https://github.com/bettergovph/open-congress-data
下载链接
链接失效反馈
官方服务:
资源简介:
菲律宾国会开放数据集:跟踪代表、参议员、法案和投票记录。透明且由社区维护的数据集,包含从第8届到第20届菲律宾国会的实体数据,包括国会、议院、委员会、人员和立法文件等结构化信息。

Philippine Congress Open Dataset: Tracks representatives, senators, bills and voting records. This transparent and community-maintained dataset contains structured entity data covering the 8th to 20th Congresses of the Philippines, including structured information such as the Congress, its chambers, committees, personnel, and legislative documents.
创建时间:
2025-09-22
原始信息汇总

菲律宾国会开放数据集概述

数据集基本信息

  • 名称: open-congress-data
  • 描述: 菲律宾国会开放数据,追踪代表、参议员、法案和投票记录
  • 特点: 透明且社区维护

数据准确性说明

⚠️ 重要提示: 该存储库中的数据为手动编码,可能包含不准确信息。我们力求准确但可能存在人为错误。如发现错误信息,请通过提交问题或拉取请求进行报告。

数据来源

  • 菲律宾参议院: https://web.senate.gov.ph
  • 众议院: https://congress.gov.ph
  • 立法文件和记录: https://ldr.senate.gov.ph
  • eCongress: https://econgress.gov.ph

数据结构

目录组织

所有数据文件组织在data/目录下,按实体类型分子目录:

  • data/congress/ - 菲律宾国会实体(第8届至第20届)
  • data/group/chamber/ - 议院实体(参议院和众议院)
  • data/committee/ - 参议院委员会实体
  • data/person/ - 参议员和代表实体
  • data/document/ - 立法文件(众议院法案和参议院法案)
    • data/document/hb/ - 按国会编号组织的众议院法案
    • data/document/sb/ - 按国会编号组织的参议院法案

实体详情

  • 国会: 代表每届菲律宾国会的中央实体(第8届至第20届)
  • 议院(组): 代表特定国会的参议院或众议院
  • 委员会: 在特定国会内运作的参议院委员会
  • 人员: 在各届国会服务的参议员和代表
  • 文件: 立法文件,包括众议院法案(HB)和参议院法案(SB)

关系层次结构

  1. 国会是顶级实体
  2. 议院(参议院/众议院)属于特定国会
  3. 委员会属于特定国会
  4. 人员是议院成员(不直接与国会连接)
  5. 文件在特定国会中提交并由人员撰写

人员成员结构

人员实体包含定义其议院隶属关系的memberships数组,允许追踪在不同国会期间在不同议院服务的政治家。

数据库同步

先决条件

  1. Neo4j数据库实例(本地或远程)
  2. Python 3.7+
  3. 必需的Python包:neo4jtomlkitpyyamlpython-dotenv

同步命令

bash

正常同步(更新现有数据)

python scripts/sync_to_neo4j.py

先清除数据库(带确认提示)

python scripts/sync_to_neo4j.py --clear

无确认清除数据库(用于CI/CD)

python scripts/sync_to_neo4j.py --clear --yes

同步优化

  • 大型批处理操作(每批1000个文档)
  • 文件加载期间进度跟踪
  • 分组查询的优化关系创建
  • 自动索引以实现最佳查询性能

许可证

本存储库根据CC0 1.0 Universal (CC0 1.0) Public Domain Dedication专用于公共领域。

  • 无版权
  • 无保留权利
  • 无需署名

许可证详情:https://creativecommons.org/publicdomain/zero/1.0/

搜集汇总
数据集介绍
main_image_url
构建方式
在菲律宾国会数据开放领域,该数据集通过人工编码的方式系统整合了来自官方渠道的公开信息,涵盖参议院、众议院官方网站以及立法文件记录系统。构建过程严格遵循层级化数据架构,将国会实体按届次划分,并建立议员、委员会、立法文件之间的关联关系,形成完整的政治生态图谱。数据组织采用模块化目录结构,通过实体关系图清晰展现国会运作机制中各要素的相互作用。
特点
该数据集最显著的特征在于其完整覆盖了菲律宾第8至20届国会的全量政治数据,采用双向关联设计实现议员跨届次任职轨迹的精准追踪。数据结构严格模拟国家立法机构的两院制特征,通过成员资格数组记录政治人物在参众两院的职务变迁。所有数据文件均采用标准化格式存储,支持通过图数据库进行复杂关系网络分析,为政治学研究提供多维度的观察视角。
使用方法
研究人员可通过预置的Neo4j同步脚本将数据导入图数据库系统,利用密码查询语言开展立法行为模式分析。数据集采用无权限要求的CC0协议开放,支持商业与非商业场景下的自由使用。用户可通过提交问题报告或修改请求参与数据质量维护,社区协作机制确保数据持续更新。该数据集特别适用于立法效率评估、政治网络分析等研究领域,为民主进程研究提供基础数据支撑。
背景与挑战
背景概述
在数字治理与立法透明化浪潮推动下,open-congress-data数据集由菲律宾社区开发者于21世纪10年代后期创建,旨在系统化追踪菲律宾国会运作轨迹。该数据集聚焦于立法机构动态监测,涵盖第8至20届国会期间参众两院结构、议员履职记录及法案演进历程,通过聚合官方门户网站与立法档案平台数据,构建起多实体关联的立法知识图谱。其核心价值在于打破政府信息壁垒,为政治学定量研究、政策影响力分析及公众监督提供结构化数据支撑,显著推动了东南亚地区立法开放数据的实践进程。
当前挑战
该数据集面临双重挑战:在领域问题层面,需解决异构立法数据融合难题,包括跨届国会成员职务变迁追踪、双轨制立法程序建模,以及法案演进路径的多维度标注;在构建过程中,人工编码机制导致数据质量风险,原始政府数据的非结构化特征增加了实体关系抽取复杂度,而动态更新的立法生态要求持续维护实体一致性。此外,双议院制下的委员会议程与投票记录缺失,进一步制约了立法行为全周期分析的完整性。
常用场景
经典使用场景
在政治学与公共政策研究领域,open-congress-data数据集为分析菲律宾立法体系提供了结构化数据支撑。研究者可通过该数据集追踪第8至20届国会期间议员动态、法案演进及投票记录,尤其适用于探究立法者跨议院流动模式——如众议员转任参议员的职业轨迹,其多层次实体关系架构精准映射了菲律宾两院制国会的运作机制。
实际应用
在政府透明度建设实践中,该数据集成为公民社会监督立法进程的重要工具。新闻机构可基于法案提交时间序列分析立法热点变迁,监察组织能通过议员投票记录比对发现政策立场规律。其Neo4j图数据库同步功能更支持复杂关系挖掘,例如识别跨委员会协作网络或追踪特定利益相关方推动的立法议程。
衍生相关工作
基于该数据集的图神经网络建模已成为立法预测研究的前沿方向。学者通过嵌入表示学习构建议员政策空间图谱,衍生出立法结果预测、政治联盟检测等经典工作。其实体关系范式更启发了多国议会数据的标准化进程,推动形成了跨国比较立法学研究的开源基础设施。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作