DenyTranDFW/BANK_2021_BNK32_1848411
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BANK_2021_BNK32_1848411
下载链接
链接失效反馈官方服务:
资源简介:
数据集 BANK 2021-BNK32 包含美国证券交易委员会(SEC)ABS-EE资产级别备案,涉及CIK 1848411。数据集包含39份备案文件,82个Parquet文件,总大小为5.4 MB。报告期从2021年3月11日至2024年5月13日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按无破折号的登记号(accession_nodash)和展品名称(exhibit_name)组织。README还提供了详细的备案索引,包括CIK、表格类型、登记号、报告日期和每份备案的URL。
The dataset BANK 2021-BNK32 contains SEC ABS-EE asset-level filings for CIK 1848411. It includes 39 filings, 82 Parquet files, with a total size of 5.4 MB. The reporting period spans from 2021-03-11 to 2024-05-13. The Parquet files are loan-level/asset-level data extracted from XML exhibits, organized as {accession_nodash}/{exhibit_name}.parquet. The README also provides a filing index with details on CIK, form type, accession number, report date, and URL for each filing.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源于美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,聚焦于CIK编号为1848411的发行实体BANK 2021-BNK32。通过系统性地采集该实体自2021年3月至2024年5月期间提交的39份资产层级申报文件,从中提取XML附件中的逐笔贷款与资产明细数据,并将其高效转化为82个Parquet格式文件。每个Parquet文件依据SEC存取编号与附件名称进行组织,确保了数据来源的完整可溯源性,同时借助资产层级XML中的报告期截止日期字段,实现了对数据时间维度的精准刻画。
使用方法
用户可通过编程语言(如Python)直接加载Parquet文件进行数据分析,利用Pandas或Dask等库读取各个附件中的资产明细表。由于文件按{(accession_nodash)}/{(exhibit_name)}.parquet的路径层级存储,研究者能够针对特定申报期或特定附件开展聚焦分析。该数据集特别适用于构建资产支持证券的现金流预测模型、评估贷款池信用风险,以及追踪基础资产在报告期内的偿付行为与违约模式,为金融监管与量化研究提供了坚实的数据基石。
背景与挑战
背景概述
BANK_2021_BNK32_1848411 数据集是围绕美国证券交易委员会(SEC)ABS-EE(资产支持证券-逐项披露)制度下的特定发行项目构建的,具体对应 CIK 为 1848411 的 BANK 2021-BNK32 交易。该数据集创建于 2021 年,由研究机构或数据科学家从 SEC EDGAR 系统提取并整理,核心研究问题在于系统化地收集、归档与解析资产支持证券(ABS)在存续期内的逐笔贷款层面数据,以便进行证券化产品的表现追踪、风险建模与金融稳定性研究。该数据集覆盖 2021 年 3 月至 2024 年 5 月的 39 份备案文件,包含 82 个 Parquet 文件,总大小约 5.4 MB,其结构化形式使得原本散落在 XML 附件中的关键资产信息得以统一访问,为 ABS 市场的透明化分析提供了重要的数据基础设施。
当前挑战
该数据集所应对的领域挑战主要在于 ABS 市场长期以来面临的信息不对称与数据碎片化问题。在证券化交易中,基础贷款的逐笔表现数据(如偿付状态、拖欠率、提前还款等)往往分散于多个非标准化 XML 附件中,难以被金融监管者、投资者或研究人员高效利用,从而阻碍了风险量化和定价模型的精细化。在数据集构建过程中,挑战包括从 SEC 的 EDGAR 平台准确抓取所有相关 ABS-EE 备案文件,从半结构化的 XML 中解析并提取无缺失的贷款级关键字段,以及确保跨越近三年的月度报送数据在时间轴上的一致性和可追溯性,最终转换为高效的 Parquet 格式以便于下游分析。
常用场景
经典使用场景
在资产证券化研究领域,BANK 2021-BNK32数据集为学者们提供了一扇洞察商业抵押贷款支持证券(CMBS)底层资产表现的神秘窗口。该数据集收录了自2021年至2024年间共计39份SEC ABS-EE合规申报文件,内含82个Parquet格式的逐笔贷款与资产层级数据,信息来源于EDGAR系统中XML附件的结构化解析。研究者可借此深入剖析CMBS交易中单个贷款的还款行为、违约风险分布与现金流波动模式,从而精准刻画资产池的信用质量演变轨迹。尤为重要的是,其时间跨度跨越了后疫情时代的经济复苏期,使得对宏观冲击下资产表现的动态研究成为可能,为构建更稳健的风险定价模型提供了坚实的实证基础。
解决学术问题
长久以来,资产证券化市场的信息不对称问题始终困扰着学术界,尤其是底层资产逐笔数据的匮乏阻碍了对结构化产品内在风险的精准评估。BANK 2021-BNK32数据集的问世,有效弥合了这一鸿沟,使得研究者能够绕过传统聚合数据的局限性,直接审视贷款层面的微观特征。它促进了关于CMBS提前偿付与违约驱动因素的实证分析,帮助学界验证并修正了经典的结构化模型假设,例如贷款价值比、债务偿付覆盖率等指标在实际违约预测中的效力。围绕这一数据集展开的工作,不仅深化了对贷款异质性如何影响证券化产品层级(Tranche)现金流分配机制的理解,也为监管层优化ABS信息披露框架提供了溯源性数据支持,推动了金融透明度的理论探讨。
实际应用
在实际金融运作中,BANK 2021-BNK32数据集扮演着连接监管合规与量化风控的关键纽带。金融机构可利用其中的资产层级数据,对标SEC要求进行内部尽职调查与信息披露演练,确保自身CMBS产品的申报流程符合ABS-EE规则。投资经理与风险管理团队则能依托贷款层面的历史还款与违约记录,回测并优化其信用评分模型,实现对不同信用等级贷款的未来表现进行更为精准的预估。此外,该数据集还能被用于构建压力测试场景,模拟在利率攀升或商业地产价值下跌等极端环境下,资产池的损失分布如何传导至各优先级债券,从而指导投资组合的久期匹配与资本配置决策,切实提升资产证券化市场的运行效率与稳健性。
数据集最近研究
最新研究方向
在资产证券化(ABS)领域,该数据集聚焦于BANK 2021-BNK32这一特定交易池的资产层面微观数据,为深入剖析商业抵押贷款支持证券(CMBS)的偿付表现与风险演变提供了宝贵的时间序列素材。伴随美国监管层对ABS-EE(资产支持证券资产级数据)披露要求的持续强化,该数据集所涵盖的2021年至2024年期间恰好横跨后疫情时代房地产市场剧烈波动、利率快速攀升以及区域性银行流动性危机等关键事件,使得研究者得以追踪单笔贷款的信用质量迁移、提前偿付模式以及损失分布特征。前沿研究方向由此转向利用细粒度资产数据构建基于机器学习的违约预测模型与现金流压力测试框架,以更精准地评估结构性产品的系统性风险。这一数据集的公开化不仅促进了透明金融市场的建设,更为学术与业界在监管科技(RegTech)推动下实现数据驱动的风险定价与资产组合优化提供了实证基石。
以上内容由遇见数据集搜集并总结生成



