five

DenyTranDFW/BANK_2022_BNK40_1907569

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BANK_2022_BNK40_1907569
下载链接
链接失效反馈
官方服务:
资源简介:
BANK 2022-BNK40数据集包含美国证券交易委员会(SEC)ABS-EE资产级别备案文件,针对CIK 1907569(BANK 2022-BNK40)。数据集包含36份备案文件,92个Parquet文件,总大小为4.8 MB。报告期从2022年3月11日开始,到2026年2月11日结束。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate。

SEC ABS-EE asset-level filings for CIK 1907569 (BANK 2022-BNK40). The dataset includes 36 filings, 92 Parquet files, and has a total size of 4.8 MB. The reporting period spans from 2022-03-11 to 2026-02-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在资产支持证券(ABS)领域,精准的逐笔贷款层面数据是进行风险分析与定价模型的基石。BANK_2022_BNK40_1907569数据集正是基于美国证券交易委员会(SEC)的ABS-EE(资产级数据电子化申报)框架构建而成。该数据集通过程序化手段,从CIK编号为1907569(对应BANK 2022-BNK40交易)的36份ABS-EE申报文件中,提取XML附录中所包含的资产级数据。这些原始XML文件被系统性地解析并转换为92个Parquet格式文件,总计数据量约4.8 MB,每个Parquet文件按申报文件编号与展品名称进行组织,从而确保了数据来源的可追溯性与结构化程度。
使用方法
用户可以直接通过Python的Pandas库或DuckDB等支持Parquet格式的引擎加载该数据集中的文件,并依据accession_nodash字段与exhibit_name进行数据合并或筛选。利用数据中隐含的reportingPeriodEndingDate字段,用户能够轻松地按时间序列对贷款绩效指标(如本金余额、利率及逾期状态)进行动态分析。对于希望深入挖掘资产池结构或构建现金流预测模型的金融科技研究者而言,建议将本数据集与SEC EDGAR原始申报系统中的其他展品(如交易结构文档)结合使用,以获取更为完整的交易背景信息。
背景与挑战
背景概述
资产支持证券(ABS)作为结构化金融产品,其风险定价高度依赖于底层资产的逐笔数据。美国证券交易委员会(SEC)自2018年起推行ABS-EE规则,要求发行人披露资产层面的标准化XML文件,以提升市场透明度。BANK_2022_BNK40数据集正是针对CIK代码1907569对应的特定资产池,由SEC EDGAR系统在2022年至2026年间持续收集,涵盖36份申报文件与92个Parquet文件,总规模4.8 MB。该数据集核心研究问题聚焦于商业抵押贷款支持证券(CMBS)的现金流预测与违约风险评估,为金融科技、监管合规和结构化产品建模提供了高粒度的时序资产信息,对推动ABS二级市场的风险定价研究具有重要基础支撑作用。
当前挑战
BANK_2022_BNK40数据集所解决的领域问题在于,传统ABS分析多依赖汇总级数据,难以捕捉单笔贷款的信用迁徙与提前偿还行为,而该数据集的资产级粒度让研究者能够进行微观层面的偿债模拟。构建过程中的挑战主要体现在三方面:其一,SEC的ABS-EE XML格式虽标准化,但不同发行人对于还款日期、利率重置等字段的编码方式存在细微差异,清洗时需逐一校验;其二,数据包含跨越四年的报告期,但部分月份的申报存在缺失或延迟,需通过时空插补技术恢复连续时间序列;其三,Parquet文件虽压缩高效,但跨访问号与表名的组织方式增加了多期数据整合的难度,尤其是需要将财务报表与抵押物特征字段进行深度关联对齐。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,BANK 2022-BNK40数据集为剖析商业抵押贷款支持证券(CMBS)的微观结构提供了宝贵的素材。该数据集源自美国证券交易委员会(SEC)的ABS-EE强制性披露要求,收录了BANK 2022-BNK40交易自2022年3月至2026年2月期间共36份月度资产级XML申报文件,并以Parquet格式组织了92个贷款层面的数据表格。研究者常利用这些细粒度的资产绩效数据,如还款记录、贷款余额变动及抵押品状态等,来构建CMBS的现金流模型,或是追踪单一资产的信用风险演变轨迹。作为标准化的监管披露数据集合,它使得对特定交易底层资产池的纵向动态分析成为可能,为理解结构化金融产品的内在风险传导机制奠定了数据基础。
解决学术问题
该数据集有效回应了资产证券化领域长期存在的透明度困境,尤其解决了因信息不对称所导致的学术研究瓶颈。传统的CMBS研究往往受限于汇总层面的数据,难以精确评估个体贷款行为对整体证券池风险的贡献。BANK 2022-BNK40提供的高频、标准化贷款级信息,使得学者能够深入检验资产违约的触发因素、提前偿还的规律性,以及抵押品估值变动与信用事件间的关联。它推动了关于ABS信息披露质量与市场定价效率之间关系的实证研究,并支持了对监管政策效果的评估。此举不仅丰富了结构化金融微观理论的实证基础,也为建立更审慎的风险计量模型提供了关键的数据支撑。
实际应用
在实际金融领域,BANK 2022-BNK40数据集中的资产级数据被广泛应用于信用评级机构的模型校验与风险预警系统的开发。评级分析师依赖这些详尽的贷款绩效指标来动态更新对CMBS各档证券的信用评级,评估在不利经济情景下底层资产的抗压能力。同时,投资机构利用该数据建立内部风控模型,识别投资组合中的潜在风险点,并优化资产配置策略。此外,监管机构也借助此类标准化披露数据进行市场一致性比较,监控系统性风险的集聚。通过解析近四年的月度连续数据,市场参与者能够更精准地把握商业地产抵押贷款市场的周期性波动,从而做出更为审慎的投资与监管决策。
数据集最近研究
最新研究方向
在资产证券化(ABS)领域,BANK 2022-BNK40数据集为研究商业抵押贷款支持证券(CMBS)的资产级风险动态提供了关键窗口。伴随全球利率环境剧变与商业地产市场波动,该数据集通过SEC ABS-EE申报中的逐笔贷款级Parquet文件,使学者能够追踪从2022年3月至2026年2月间抵押贷款的还款表现、拖欠率与提前偿付行为。前沿研究聚焦于利用此类细粒度数据构建机器学习模型,预测不同经济周期下资产池的信用风险敞口,并评估美联储加息周期对商业地产估值及结构化产品定价的传导效应。该数据集的高频率(月频)更新与长达四年的观测期,为验证压力场景下的违约相关性假设与优化风险分层模型提供了实证基础,对完善后金融危机时代的宏观审慎监管工具有着深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作