Open Government Data - Philippine Budget Graph Database
收藏github2025-10-08 更新2025-10-12 收录
下载链接:
https://github.com/bettergovph/open-budget-data
下载链接
链接失效反馈官方服务:
资源简介:
一个全面的数据管道,将菲律宾政府预算数据(NEP/GAA)和UACS参考数据转换为Neo4j图数据库,用于高级分析和可视化。该项目处理了2020-2026财年的680多万条预算记录,包含组织层次结构、地理位置、资金来源和支出分类等综合参考数据。
A comprehensive data pipeline that transforms Philippine government budget data (NEP/GAA) and UACS reference data into a Neo4j graph database for advanced analytics and visualization. This project processes over 6.8 million budget records spanning fiscal years 2020 to 2026, and incorporates comprehensive reference data including organizational hierarchies, geographic locations, funding sources, and expenditure categories.
创建时间:
2025-10-05
原始信息汇总
菲律宾政府预算图数据库数据集概述
数据集基本信息
- 项目名称: 开放政府数据 - 菲律宾预算图数据库
- 创建组织: BetterGov.PH
- 数据来源: 菲律宾政府预算数据(NEP/GAA)和UACS参考数据
- 目标数据库: Neo4j图数据库
数据规模
- 预算记录总数: 6,858,701条(NEP + GAA 2020-2026)
- 总预算金额: ₱106.9万亿
- 节点总数: 70,000+个
- 处理文件数: 13个预算文件(7个NEP + 6个GAA)
数据结构
预算记录维度
- BudgetRecord: 包含财政拨款的个人预算项目
- 属性:id、budget_type、fiscal_year、amount、description、prexc_fpap_id、sort_order
组织层次结构(14,953个节点)
- Department: 顶级行政部门(40个实体)
- Agency: 部门下的政府机构(466个实体)
- OperatingUnitClass: 运营单位分类(26个实体)
- OperatingUnit: 机构内的运营单位(14,461个实体)
- Organization: 完整组织实体(14,461个实体)
地理位置层次结构(53,263个节点)
- Region: 菲律宾行政区划(17个实体)
- Province: 省级划分(82个实体)
- CityMunicipality: 城市和自治市(1,634个实体)
- Barangay: 镇级位置(42,046个实体)
资金来源维度(806个节点)
- FundCluster: 主要资金分组
- FinancingSource: 融资来源
- Authorization: 预算授权类型
- FundCategory: 资金类别分类
- FundingSource: 完整资金来源(806个实体)
支出分类维度(683个节点)
- Classification: 顶级支出分类
- SubClass: 支出子分类
- ExpenseGroup: 分组支出类别
- Object: 支出对象代码
- SubObject: 详细支出子对象(683个实体)
项目/活动实体
- SectorOutcome: 政府部门成果
- HorizontalProgram: 跨领域项目
关系层次结构
预算记录关系
- ALLOCATED_TO → Organization
- LOCATED_IN_REGION → Region
- FUNDED_BY → FundingSource
- CLASSIFIED_AS → SubObject
组织层次关系
Department → HAS_AGENCY → Agency → HAS_OPERATING_UNIT_CLASS → OperatingUnitClass → HAS_OPERATING_UNIT → OperatingUnit
地理位置层次关系
Region → HAS_PROVINCE → Province → HAS_CITY → CityMunicipality → HAS_BARANGAY → Barangay
资金来源层次关系
FundCluster → HAS_FINANCING_SOURCE → FinancingSource → HAS_AUTHORIZATION → Authorization → HAS_FUND_CATEGORY → FundCategory → HAS_FUNDING_SOURCE → FundingSource
支出分类层次关系
Classification → HAS_SUB_CLASS → SubClass → HAS_GROUP → ExpenseGroup → HAS_OBJECT → Object → HAS_SUB_OBJECT → SubObject
UACS代码结构
组织代码(12位数字)
格式: [部门(2)][机构(3)][类别(2)][下级运营单位(5)]
资金来源代码(8位数字)
格式: [资金集群(2)][融资来源(1)][授权(2)][类别(3)]
对象代码(10位数字)
格式: [分类(1)][子类(2)][组(2)][对象(3)][子对象(2)]
位置代码(PSGC代码)
格式: [区域(2)][省份(2)][城市(2)][镇(3)]
数据统计
预算覆盖范围(2020-2026)
| 财政年度 | NEP记录数 | GAA记录数 | 总金额 |
|---|---|---|---|
| 2020 | 578,234 | 64,999 | ₱8.33万亿 |
| 2021 | 64,999 | 498,342 | ₱4.99万亿 |
| 2022 | 64,999 | 628,668 | ₱10.55万亿 |
| 2023 | 674,011 | 650,369 | ₱21.07万亿 |
| 2024 | 719,974 | 682,814 | ₱23.07万亿 |
| 2025 | 736,593 | 723,105 | ₱25.36万亿 |
| 2026 | 771,594 | - | ₱13.59万亿 |
参考数据统计
| 维度 | 数量 | 描述 |
|---|---|---|
| 部门 | 40 | 顶级政府部门 |
| 机构 | 466 | 政府机构 |
| 运营单位 | 14,461 | 组织单位 |
| 区域 | 17 | 菲律宾区域 |
| 省份 | 82 | 菲律宾省份 |
| 城市/自治市 | 1,634 | 城市和自治市 |
| 镇 | 42,046 | 镇级位置 |
| 资金来源 | 806 | 预算资金来源 |
| 支出类别 | 683 | 对象代码分类 |
搜集汇总
数据集介绍

构建方式
在政府财政数据治理领域,该数据集通过系统化数据管道构建而成。其核心处理流程涵盖原始预算文档的格式转换与多维度参考数据的集成,采用模块化脚本分别处理组织机构、地理区域、资金来源与支出分类等实体。数据转换阶段将Excel与JSON格式的原始文件统一映射为标准化图结构,随后通过Neo4j同步脚本实现节点与关系的批量加载,最终形成包含680万条预算记录与7万余个实体的属性图数据库。
特点
该数据集最显著的特征在于其多维关联的数据模型设计。预算记录作为核心节点,通过四类关系链分别连接组织机构层级、地理行政体系、资金来源分类与支出对象编码,形成完整的财政数据拓扑网络。数据覆盖2020至2026财年的国家支出计划与总拨款法案,包含106.9万亿比索的预算总额,并严格遵循菲律宾统一账户编码标准,确保各类实体编码在部门、区域、资金与支出维度间的语义一致性。
使用方法
研究者可通过Cypher查询语言实现多维度财政分析。典型应用场景包括追踪部门预算分配路径、分析区域资金分布模式、追溯资金来源层级结构以及解构支出分类体系。数据加载流程需依次执行参考数据转换、预算记录映射与图数据库同步三个步骤,通过环境变量配置Neo4j连接参数后,使用专用脚本实现6.8百万条记录的高效批量导入,最终构建支持复杂路径查询的财政知识图谱。
背景与挑战
背景概述
菲律宾政府预算图数据库由BetterGov.PH于2020年代初期创建,旨在通过图数据库技术重构菲律宾国家预算数据体系。该项目整合了2020至2026财年的国家支出计划与总拨款法案数据,涵盖680万条预算记录及7万余个实体节点,构建了包含组织机构、地理区域、资金来源与支出分类的多维关联网络。该数据集通过统一账户代码结构实现预算流向的可视化追踪,为公共财政透明度研究提供了结构化分析基础,推动了政府数据开放与廉政建设的交叉学科发展。
当前挑战
该数据集需解决政府预算多维度关联分析的复杂性挑战,包括跨年度预算数据一致性验证、异构数据源(如Excel与JSON格式)的语义对齐,以及UACS编码体系在层级嵌套中的完整性维护。构建过程中面临大规模实体关系建模的技术瓶颈,需处理106.9万亿比索预算金额的数值精度保障,并克服70余类节点属性在Neo4j图结构中的动态索引优化难题。
常用场景
经典使用场景
在公共财政分析领域,该数据集通过图数据库结构实现了对菲律宾政府预算的深度解析。研究者能够运用Cypher查询语言追踪预算资金在组织层级与地理区域间的流转路径,例如分析特定部门在历年预算分配中的演变趋势,或探究不同地区基础设施投资的分布模式。这种图结构建模使得多维度关联分析成为可能,比如将教育部门的预算分配与地方行政区划、资金来源类型进行交叉比对,从而揭示财政资源配置的内在逻辑。
衍生相关工作
基于该数据集的图神经网络模型已在财政风险预警领域取得突破,衍生出预算偏差自动检测系统。多项研究利用其时空维度开发了财政可持续性评估指标,构建了部门间资金流动的网络拓扑分析框架。在开源社区推动下,已有学者将Neo4j图算法应用于预算腐败识别,开发出基于节点中心性的异常交易探测模型,这些成果为全球开放政府数据运动提供了可复用的技术范式。
数据集最近研究
最新研究方向
在开放政府数据与财政透明度研究领域,菲律宾预算图数据库通过构建涵盖2020至2026财年的680万条预算记录与多维实体关系网络,为公共财政分析提供了结构化基础。当前研究聚焦于图神经网络在跨部门资金流动模式识别中的应用,结合地理空间分析与时序预测模型,探索预算分配效率与区域发展均衡性。随着全球数字治理浪潮推进,该数据集通过Neo4j图结构实现了预算追踪的可视化与动态关联分析,为政策评估和反腐败研究提供了实证支持,推动了智能财政管理系统的前沿发展。
以上内容由遇见数据集搜集并总结生成



