Outlays
收藏Hugging Face2025-05-08 更新2025-05-09 收录
下载链接:
https://huggingface.co/datasets/leeroy-jankins/Outlays
下载链接
链接失效反馈官方服务:
资源简介:
这是一个记录了美国联邦政府实际支付资金的详细数据集,包括各种支付义务,如社会保障支票、对州和地方政府的拨款、国防、建设和服务的承包商支付以及国家债务利息等。数据集按照机构、账户、项目和功能分类提供了联邦开支数据,旨在支持预算执行跟踪、经济预测和建模、提高透明度和责任、公共财政领域的机器学习和AI研究以及基础设施和刺激计划的跟踪。
创建时间:
2025-05-08
原始信息汇总
数据集概述:U.S. Federal Outlays Dataset – Budget Execution in Action
📜 基本信息
- 许可证: mit
- 维护者: Terry Eppler
- 数据来源: 美国管理和预算办公室(OMB)、美国财政部
- 标准: OMB Circular A-11, DATA Act (Pub. L. 113–101), Treasury GTAS
🏦 数据集内容
- 联邦支出定义: 美国联邦政府的实际资金支付,包括社会保障支票、拨款支付、承包商付款和国债利息等。
- 数据用途:
- 预算执行跟踪
- 经济预测和建模
- 透明度和问责制
- 公共财政的机器学习和AI研究
- 基础设施和刺激跟踪
📊 数据结构
| 列名 | 描述 |
|---|---|
fiscal_year |
财政年度(如2023年) |
period |
月份或季度(如12表示年底) |
agency_code |
财政部3位机构ID |
main_account_code |
4位财政部账户代码 |
tas |
财政部拨款基金符号 |
gross_outlay_amount |
账户累计支付金额 |
object_class |
支出类型(如人员、合同) |
program_activity |
与预算功能和目的相关联 |
recipient_type |
接收者类型(如企业、非营利组织) |
geo_location |
支出的地理位置(如已知) |
🔍 数据重要性
| 用途 | 描述 |
|---|---|
| 预算执行 | 立法评分和实际支出跟踪的关键指标 |
| 赤字分析 | 支出 - 收入 = 赤字 |
| 宏观经济建模 | 联邦支出对GDP、就业和通胀的影响 |
| 政策评估 | 检查项目是否达到其资金水平 |
| 透明度 | 通过USAspending.gov提供公共洞察 |
🛠 示例代码
python from datasets import load_dataset import matplotlib.pyplot as plt
ds = load_dataset("your-org/federal-outlays")
Filter for Department of Health and Human Services
hhs = ds.filter(lambda x: x["agency_code"] == "075")
Sum outlays by fiscal year
import pandas as pd df = pd.DataFrame(hhs) summary = df.groupby("fiscal_year")["gross_outlay_amount"].sum()
Plot it
summary.plot(kind="bar", title="HHS Outlays by Fiscal Year") plt.ylabel("USD ($ Billions)") plt.show()
搜集汇总
数据集介绍

构建方式
该数据集基于美国联邦政府的实际财政支出数据构建,数据来源为美国行政管理与预算局(OMB)及财政部。依据OMB A-11号通告和《数据法案》(Pub. L. 113–101)等规范标准,数据集通过系统化采集财政部GTAS系统中的支付记录,涵盖各财政年度、机构、账户及项目的详细支出信息。数据经过标准化处理,确保与USAspending.gov等官方平台的一致性。
特点
数据集以多维结构呈现联邦财政支出全貌,包含财政年度、机构代码、主账户代码、国库拨款基金符号等关键字段,并标注支出类型、项目活动及受助方类别。其突出特点在于精确记录实际支付金额(而非预算金额),反映资金流动的真实动态。数据具有细粒度特征,可支持从宏观经济分析到具体项目评估的多层次研究需求。
使用方法
研究人员可通过Hugging Face的datasets库直接加载数据集,利用Python生态工具进行深度分析。典型应用包括按机构/项目聚合支出趋势、构建财政政策影响模型,或与宏观经济指标进行关联分析。数据集支持pandas等工具进行快速处理,示例代码演示了如何可视化特定部门的年度支出变化,为政策效果评估提供直观依据。
背景与挑战
背景概述
美国联邦支出数据集(Outlays)由美国行政管理和预算局(OMB)及财政部联合构建,旨在记录联邦政府实际支付的资金流向。该数据集依据《数据法案》(DATA Act)和财政部政府范围总账标准(GTAS)等法规标准,系统性地捕捉了各机构、账户、项目及功能维度的支出详情。作为公共财政领域的核心数据资源,它不仅为预算执行监督提供了量化依据,更成为宏观经济建模、政策效果评估和透明度建设的重要基础设施。自创建以来,该数据集通过USAspending.gov等平台持续推动政府支出的可视化与公众监督。
当前挑战
在解决联邦资金追踪的领域问题上,该数据集面临多维度挑战:跨部门数据标准不统一导致账户编码与项目活动的映射复杂度高;动态调整的预算科目体系要求持续更新数据架构;海量交易记录的实时性需求与财政系统批量处理的固有延迟形成矛盾。构建过程中,需克服敏感信息脱敏与数据透明度之间的平衡难题,同时确保军事等特殊领域支出在不泄露国家安全信息的前提下保持可审计性。地理空间等非结构化数据的标准化处理,亦对传统财政数据管理范式提出创新要求。
常用场景
经典使用场景
在公共财政研究领域,Outlays数据集被广泛应用于追踪和分析美国联邦政府的实际支出模式。研究人员通过该数据集能够精确掌握各机构、项目和功能类别的资金流向,为政策制定者提供数据支持。例如,经济学家利用该数据集分析社会保障、国防开支等关键领域的资金分配情况,揭示政府支出的优先次序和效率。
衍生相关工作
基于Outlays数据集,学术界已衍生出多项重要研究。其中包括开发预测政府支出的机器学习模型、构建财政政策影响评估框架,以及创建可视化工具增强数据可解释性。这些工作不仅推动了公共财政研究的量化发展,也为政府决策提供了更精准的分析方法。
数据集最近研究
最新研究方向
近年来,美国联邦支出数据集(Outlays)在公共财政与宏观经济研究领域展现出显著价值。随着联邦政府支出透明度要求的提升和《数据法案》的深化实施,该数据集成为量化财政政策效果的关键工具。前沿研究聚焦于利用机器学习模型预测财政支出对区域经济的影响,特别是在公共卫生(如COVID-19应急拨款)和基础设施投资(如《两党基础设施法》)等热点领域。通过时序分析与自然语言处理技术的结合,学者们正探索支出数据与政策文本的关联性,以评估预算执行效率。此外,该数据集还被用于构建动态可计算一般均衡(CGE)模型,模拟不同财政情景下的宏观经济效应,为政策制定提供实证支持。
以上内容由遇见数据集搜集并总结生成



