SF133
收藏Hugging Face2025-05-08 更新2025-05-09 收录
下载链接:
https://huggingface.co/datasets/leeroy-jankins/SF133
下载链接
链接失效反馈官方服务:
资源简介:
SF 133数据集是美国政府官方的财务报告,用于追踪和报告联邦机构如何执行其预算。该数据集每季度提交一次,按照OMB Circular A-11, Section 130的标准制作,包含多个联邦机构和财政账户的机器可读SF 133数据。数据集支持监督和透明度、预算编制、模型训练以及公共和学术研究。
创建时间:
2025-05-08
原始信息汇总
SF 133: 预算执行和预算资源报告数据集概述
基本信息
- 维护者: Terry Eppler
- 数据来源: 美国管理和预算办公室 (OMB) | 美国财政部
- 标准: OMB Circular A-11, Section 130
- 许可证: MIT
数据集概述
SF 133: 预算执行和预算资源报告是美国政府官方财务报告,用于跟踪和报告联邦机构如何执行其预算。该报告按季度提交,是执行部门财政透明度和控制的基础。
数据用途
- 监督与透明度:监控实际预算执行与国会意图的对比。
- 预算制定:分析支出趋势以改进未来的预算编制。
- 模型训练:支持财务预测或异常检测机器学习模型的训练。
- 公共与学术研究:为治理、经济学和政策分析提供实证数据。
数据结构
数据集基于GTAS/OMB兼容的SF 133季度提交数据,按以下字段组织:
fiscal_year: 报告的财政年度period: 报告季度(3、6、9或12个月)agency_code: 3位财政部机构标识符tas: 财政部拨款基金符号 (TAFS)line_number: SF 133行项目代码(例如1000、2000、3000)amount: 行项目的累计美元价值line_description: 根据OMB Circular A-11的行描述(例如“发生的义务”)
每行代表特定TAFS和季度的单个行条目。
关键SF 133部分
| 部分 | 描述 |
|---|---|
| 1000–1990 | 预算资源:可用的总授权 |
| 2000–2590 | 资源状态:义务与非义务余额 |
| 3000–3990 | 义务余额:未支付义务的变化 |
| 4000–4190 | 支出与抵消:净预算授权和支出 |
| 5000+ | 补充信息:过期账户、贷款融资等 |
使用示例
python from datasets import load_dataset
ds = load_dataset("your-org/sf133-budget-execution")
按机构和季度筛选
epa_q3_2021 = ds.filter(lambda row: row["agency_code"] == "068" and row["fiscal_year"] == 2021 and row["period"] == 9)
为时间序列图表旋转行项目
import pandas as pd df = pd.DataFrame(epa_q3_2021) df_pivot = df.pivot(index="line_number", columns="period", values="amount")
参考文献
搜集汇总
数据集介绍

构建方式
SF133数据集基于美国管理与预算办公室(OMB)和美国财政部的官方财务报告标准构建,严格遵循OMB A-11通告第130章节的规定。数据来源于各联邦机构按季度提交的GTAS/OMB合规SF 133报告,通过结构化提取财政年度、报告周期、机构代码、国库拨款基金符号等核心字段,形成机器可读的标准化记录。每条数据代表特定财政季度下某个国库账户的单项预算执行明细,确保数据颗粒度与原始行政文件完全一致。
特点
该数据集以独特的财政语义结构著称,包含1000-5000+的标准化预算科目代码体系,完整覆盖预算资源、义务状态、未支付义务变更等关键财务维度。其突出特点在于采用三级标识体系(财政年度-机构代码-国库账户),支持跨时间跨机构的横向对比分析。数据值采用累计金额记录方式,配合OMB官方科目描述,既满足审计追踪的精确性要求,又为机器学习模型提供丰富的特征维度。
使用方法
使用该数据集时,建议通过财政年度、报告周期和机构代码的三维过滤构建分析样本。典型应用场景包括:利用pandas进行科目代码透视分析不同季度的预算执行波动,或通过机构代码分组统计比较跨部门的资源使用效率。机器学习应用可重点挖掘3000系列义务数据与4000系列支出数据的时序关联特征,建立预算执行异常检测模型。数据加载可直接调用HuggingFace数据集接口,其原生支持按国库账户符号(TAFS)的快速检索功能。
背景与挑战
背景概述
SF133数据集是美国政府用于追踪和报告联邦机构预算执行情况的官方财务报告,由美国管理与预算办公室(OMB)和美国财政部共同维护。该数据集依据《美国法典》第31篇第1511-1514条和第1554条的法律要求,自建立以来已成为联邦政府财政透明度和预算控制的核心工具。通过季度提交的形式,SF133数据集为国会监督、预算编制和公共政策研究提供了关键数据支持,推动了财政管理和政府问责机制的现代化进程。
当前挑战
SF133数据集在应用过程中面临多重挑战。从领域问题来看,预算执行数据的复杂性和动态性使得准确建模和预测变得困难,尤其是在跨部门、跨年度的比较分析中,数据的一致性和可比性需要严格的技术处理。在构建过程中,数据集的标准化和整合面临挑战,包括不同联邦机构的财务报告格式差异、数据质量的不均衡,以及法律和会计准则的频繁更新对数据结构的影响。此外,确保数据隐私与公开透明的平衡也是该数据集持续维护中的关键问题。
常用场景
经典使用场景
SF133数据集作为美国政府预算执行的核心报告,其经典使用场景体现在联邦机构预算执行的动态监测与分析。该数据集通过季度性提交的财务数据,为研究人员和政策制定者提供了追踪预算资源分配、义务承担及支出情况的标准化框架,尤其在跨部门预算执行效率比较和财政透明度评估中具有不可替代的作用。
实际应用
在实际应用中,SF133数据被整合进联邦机构的智能预算管理系统,支持实时预算执行预警和资源优化配置。财政部利用该数据集开发了GTAS(政府范围会计系统)的异常检测模块,而国会预算办公室则将其用于《预算执行报告》的自动化生成,显著提升了财政监督的时效性和准确性。
衍生相关工作
基于SF133衍生的经典研究包括哈佛大学的联邦支出预测神经网络模型、布鲁金斯学会的预算偏离度指数,以及GAO开发的财政风险预警系统。这些工作不仅拓展了公共财政量化研究的深度,更催生了OMB在2022年发布的《AI在预算管理中的应用指南》政策框架。
以上内容由遇见数据集搜集并总结生成



