five

Cuenta Pública

收藏
github2024-05-19 更新2024-05-31 收录
下载链接:
https://github.com/lapanquecita/cuenta-publica
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了墨西哥公共账户的年度支出数据,涵盖了2013至2022年的政府各部门的总支出。数据来源于墨西哥财政部,通过不同的格式如.pdf, .doc, .xls和.csv提供,但原始数据结构不易于分析。本仓库的目标是提供这些数据的高效处理和分析方法。

This dataset encompasses the annual expenditure data of Mexican public accounts, detailing the total expenditures across various government departments from 2013 to 2022. Sourced from the Mexican Ministry of Finance, the data is provided in multiple formats including .pdf, .doc, .xls, and .csv, yet the original data structure is not conducive to analysis. The objective of this repository is to offer efficient methods for processing and analyzing these data.
创建时间:
2024-04-22
原始信息汇总

数据集概述

数据集名称

  • Cuenta Pública

数据集内容

  • 包含墨西哥2013年至2022年的公共账户数据,详细记录了政府各部门的年度总支出。

数据来源

  • 数据来源于墨西哥财政部和公共信贷部(SHCP),提供格式包括.pdf, .doc, .xls和.csv。

数据处理

  • 通过converter.py脚本从.xls文件中提取数据,转换为.csv格式,并整合为data.csv
  • 应用过滤器去除重复和不必要的数据,以确保数据的一致性。
  • 生成data_total.csv文件,仅包含各年度的总支出,适用于不需详细项目分析的场合。

数据验证

  • 通过与SHCP提供的.pdf报告中的数据进行交叉验证,确保数据的准确性。

数据调整

  • 提供调整数据以反映通货膨胀影响的代码和方法,使用消费者价格指数(IPC)进行调整。
  • 提供根据国内生产总值(PIB)调整数据的代码和方法,以帮助理解数据相对于经济规模的含义。

数据格式

  • data.csv包含经过处理和过滤的详细支出数据。
  • data_total.csv包含各年度的总支出数据。
  • IPC.csvPIB.csv分别包含消费者价格指数和国内生产总值数据,用于数据调整。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于墨西哥公共账户(Cuenta Pública)的年度支出数据,涵盖2013年至2022年。数据来源于墨西哥财政部(SHCP)提供的多种格式文件,包括PDF、DOC、XLS和CSV。为了便于分析,数据集通过脚本从原始的XLS文件中提取信息,并将其转换为结构化的CSV格式。提取过程中,脚本逐行处理数据,保留了各层级的分类信息,最终生成一个名为`data.csv`的统一文件,并额外生成一个仅包含各分支总支出的`data_total.csv`文件。
特点
该数据集的主要特点在于其详细的分支支出数据,涵盖了政府各部门的年度支出情况。数据经过清洗和去重处理,确保了数据的一致性和准确性。此外,数据集还提供了调整通胀后的支出数据,便于进行跨年度的公平比较。数据集的结构化设计使得用户可以轻松进行多维度的分析,如按部门、分支或预算类型进行筛选和汇总。
使用方法
用户可以通过加载`data.csv`文件进行详细的数据分析,使用Python脚本进行数据筛选、汇总和可视化。数据集还提供了调整通胀和按GDP比例调整的示例代码,帮助用户进行更深入的经济分析。对于需要快速获取总支出的用户,`data_total.csv`文件提供了简洁的汇总数据。此外,数据集还附带了IPC和PIB数据,用户可以根据需要进行进一步的调整和分析。
背景与挑战
背景概述
Cuenta Pública数据集是由墨西哥财政部(Secretaría de Hacienda y Crédito Público, SHCP)提供的公共财政数据集,涵盖了2013年至2022年间的政府年度支出。该数据集的核心研究问题在于如何有效分析和结构化这些复杂的财政数据,以便于学术界、政策制定者和公众进行深入研究。SHCP通过其官方网站提供了多种格式的数据文件,但这些文件的结构并不便于直接分析。因此,该数据集的主要研究人员和机构致力于通过自动化脚本将这些数据转换为更易于处理的CSV格式,从而提高数据的可访问性和分析效率。
当前挑战
Cuenta Pública数据集在构建和分析过程中面临多项挑战。首先,原始数据以多种格式(如PDF、DOC、XLS等)提供,且结构复杂,尤其是其层次化的数据组织方式,增加了数据提取的难度。其次,数据中存在重复和不一致的问题,需要通过过滤和验证来确保数据的准确性。此外,历史数据的比较需要考虑通货膨胀因素,以确保数据的公平性和准确性。最后,尽管数据集提供了详细的支出信息,但其与国内生产总值(PIB)的关联分析仍需进一步探索,以更好地理解财政支出对经济的影响。
常用场景
经典使用场景
Cuenta Pública数据集的经典使用场景主要集中在政府财政分析领域。通过该数据集,研究者和政策分析师能够系统地分析墨西哥政府在2013年至2022年间的年度总支出,按政府各部门和项目进行详细分类。这种分析有助于理解政府支出的结构和趋势,特别是在不同经济周期下的财政政策调整。
衍生相关工作
Cuenta Pública数据集的发布和整理激发了大量相关研究工作。例如,研究者利用该数据集进行财政政策对经济增长的影响分析,或探讨不同部门支出对社会福利的贡献。此外,该数据集还促进了数据分析工具和方法的发展,特别是在处理复杂财政数据和进行跨年度比较方面。
数据集最近研究
最新研究方向
近年来,关于墨西哥公共账户(Cuenta Pública)数据集的研究主要集中在财政透明度和政府支出分析领域。研究者们致力于通过数据清洗、结构化处理以及自动化工具的应用,提升对政府年度总支出的分析效率。特别是,针对2013年至2022年的数据,研究重点在于如何从复杂的层次结构中提取详细信息,并通过与官方报告的交叉验证确保数据的准确性。此外,研究还涉及对历史数据的通胀调整,以确保跨年度的支出比较具有可比性。这些研究不仅为政策制定者提供了更为精确的财政分析工具,也为公众监督政府支出提供了数据支持,进一步推动了财政透明化的进程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作