five

DenyTranDFW/BANK_2021_BNK38_1895567

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BANK_2021_BNK38_1895567
下载链接
链接失效反馈
官方服务:
资源简介:
数据集BANK 2021-BNK38包含美国证券交易委员会(SEC) ABS-EE资产级别文件,针对CIK 1895567。数据集包含39份文件,100个parquet文件,总大小为4.3 MB。报告期从2021年12月11日至2026年2月11日。parquet文件是从XML展品中提取的贷款级别/资产级别数据,按无破折号的登记号和展品名称组织。

The dataset BANK 2021-BNK38 contains SEC ABS-EE asset-level filings for CIK 1895567. It includes 39 filings, 100 parquet files, with a total size of 4.3 MB. The reporting period is from 2021-12-11 to 2026-02-11. The parquet files are loan-level/asset-level data extracted from XML exhibits, organised by accession number (without dashes) and exhibit name.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国证券交易委员会(SEC)资产支持证券(ABS)电子化填报系统(ABS-EE)所提交的资产层级申报文件。数据以Parquet格式存储,每个文件对应于特定申报的XML附件,并按照{accession_nodash}/{exhibit_name}.parquet的命名规则进行组织。数据集的构建逻辑严谨,通过对XML附件中的贷款或资产层面数据进行系统化提取与结构化处理,最终形成100个Parquet文件,涵盖39份申报文件,总容量为4.3 MB。报告期起始于2021年12月11日,终止于2026年2月11日,体现了对BANK 2021-BNK38这一资产支持证券整个生命周期的精细化数据追踪。
特点
该数据集最显著的特点在于其高度的规范性与可追溯性。所有资产层面的数据均直接源于SEC官方申报的XML附件,并保留了关键的reportingPeriodEndingDate字段,从而确保了时间维度的精确性。数据集以Parquet格式存储,这一列式存储方案在压缩效率与查询性能上具有显著优势,尤其适用于大规模结构化数据的分析场景。此外,数据集通过详细的Filing Index提供了每份申报的CIK编号、报告日期、表单类型及SEC官方链接,极大地方便了数据的来源验证与深入挖掘。
使用方法
研究人员可借助支持Parquet格式的数据分析工具(如Apache Spark、Pandas等)直接读取该数据集。数据集的组织结构清晰,每个Parquet文件均嵌入在特定申报编号的子目录下,用户能够依据需求高效定位单一申报文件内的资产层面数据,亦可跨申报进行全量数据的聚合分析。通过解析reportingPeriodEndingDate字段,可构建精准的时间序列数据,从而支持对资产池表现、现金流分布及违约风险等关键金融指标进行深入定量研究。
背景与挑战
背景概述
在资产证券化(ABS)领域,透明、标准化的资产级数据是评估风险与进行定价分析的基础。BANK_2021_BNK38_1895567数据集源自美国证券交易委员会(SEC)的ABS-EE(Asset-Backed Securities - Exhibit EE)强制性申报制度,由商业抵押贷款支持证券(CMBS)信托BANK 2021-BNK38自2021年12月至2026年2月期间提交的39份贷款级数据构成。该数据集以Parquet格式整理,涵盖100个文件,总计4.3 MB,由SEC的EDGAR系统公开采集,旨在为金融研究机构提供标准化、机器可读的资产池微观数据,助力违约预测、现金流建模及结构性产品绩效评估,深化对CMBS市场动态的理解。
当前挑战
该数据集解决的领域问题在于:传统ABS信息披露以非结构化PDF形式存在,难以系统化提取与跨期对比,阻碍了批量分析与模型训练。构建过程中的挑战包括:1)从XML附件的复杂嵌套结构中精准提取每笔贷款的字段(如还款状态、利率、余额),需应对标签多样性及缺失值;2)跨39个申报周期保持数据一致性,处理由于会计准则变化或发行方错误导致的格式偏差;3)将分散的资产级数据与信托整体评级、交易结构关联,以支持全生命周期风险评估。
常用场景
经典使用场景
在资产证券化领域,BANK 2021-BNK38数据集作为商业抵押贷款支持证券(CMBS)的标准化信息披露载体,其核心应用场景聚焦于逐笔贷款层面的资产表现分析。该数据集源自美国证券交易委员会(SEC)的ABS-EE强制性披露规则,汇集了从2021年至2026年间共计39份定期申报文件中的资产级XML数据。研究者能够利用其Parquet格式的结构化字段,开展对抵押贷款池内单笔贷款的还款行为、违约概率及提前偿付风险的精细测算,从而为评估资产池的信用质量与现金流稳定性提供严谨的数据基础。
实际应用
在实际金融操作中,该数据集被广泛应用于信用评级机构的内部模型校验与投资组合的风险压力测试。评级分析师可通过比对同一发行方的多期历史数据,校准其针对商业物业贷款违约损失率的估算参数。同时,资产管理公司借助这些细颗粒度的资产表现记录,能够实时监测池内资产的异动信号,例如租金收入下滑或物业估值回调等早期预警指标。此外,监管机构也可援引此类数据,对系统性风险进行前瞻性评估,从而在宏观审慎政策制定中嵌入更灵敏的风险阈值。
衍生相关工作
基于BANK 2021-BNK38这类ABS-EE数据,学界衍生出一系列具有深远影响力的经典研究。围绕该数据源,学者们构建了多期面板回归模型,以揭示借款人信用评分、贷款价值比与违约时点之间的非线性关系。另有工作聚焦于机器学习驱动的提前偿付预测器,利用树模型与深度网络捕捉时序特征中的复杂交互模式。此外,部分研究将此数据集与宏观利率及房地产价格指数相融合,拓展出能够同时评估信用风险与市场风险的联合动态框架,为结构化产品的估值与风险管理开辟了全新的实证路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作