DenyTranDFW/BANK_2020_BNK29_1830315
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BANK_2020_BNK29_1830315
下载链接
链接失效反馈官方服务:
资源简介:
数据集BANK 2020-BNK29包含美国证券交易委员会(SEC)ABS-EE资产级别备案文件,涉及CIK 1830315。数据集包含43份备案文件,92个Parquet文件,总大小为5.5 MB,报告期为2020年11月11日至2024年5月13日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。README还提供了详细的备案索引,包括CIK、表格类型、备案号、报告日期和URL。
The dataset BANK 2020-BNK29 consists of SEC ABS-EE asset-level filings for CIK 1830315. It includes 43 filings, 92 Parquet files, totaling 5.5 MB in size, with a reporting period from 2020-11-11 to 2024-05-13. The Parquet files contain loan-level/asset-level data extracted from XML exhibits, organized as {accession_nodash}/{exhibit_name}.parquet. The README also provides a detailed filing index with CIK, form type, accession number, report date, and URL for each filing.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
资产支持证券(ABS)作为结构化金融产品,其信息披露的规范性与透明度对市场参与者的风险判别至关重要。本数据集聚焦于BANK 2020-BNK29(CIK 1830315)这一特定资产支持证券项目,系统采集了其向美国证券交易委员会(SEC)提交的ABS-EE资产层级电子化备案文件。数据集涵盖自2020年11月至2024年5月期间共计43份申报材料,通过解析XML展品中的贷款级/资产级数据,生成了92个Parquet格式文件。文件组织结构以'${无连字符备案编号}/${展品名称}.parquet'为命名规则,而报告期日期则直接源于资产层级XML中的'reportingPeriodEndingDate'字段,确保了时间维度的精准对齐。
特点
该数据集的核心价值在于其高时效性与细粒度特征。从时间跨度上看,它覆盖了长达三年半的持续报告周期,能够支持对证券化资产池在存续期内信用表现与现金流演变进行纵向追踪。数据存储采用高效的Parquet列式存储格式,相较于传统CSV文件,在存储空间占用(总大小仅5.5 MB)和查询性能方面具有显著优势。作为标准化资产层级数据,每条记录均包含详尽的贷款属性与还款历史信息,能够满足从宏观资产池流动性分析到微观单笔贷款违约预测等多层次研究需求。
使用方法
本研究数据集以Parquet文件形式提供,用户可通过Python的pandas库结合'pyarrow'或'fastparquet'引擎便捷地加载与处理。使用时,首先遍历各备案文件夹,依据研究所需的特定展品名称加载对应Parquet文件。由于数据源自SEC官方结构化披露,字段含义与XML模式(Schema)严格对应,建议结合SEC ABS-EE数据词典进行字段映射与清洗。该数据集天然的时序属性使其特别适用于构建资产池偿付能力模型、测算提前偿付率(CPR)与违约率(CDR),或评估不同宏观情景下证券化产品的信用风险敞口。
背景与挑战
背景概述
在资产支持证券(ABS)领域,透明、标准化的资产层面数据对于精准定价、风险评估与市场监管至关重要。BANK_2020_BNK29_1830315数据集诞生于后金融危机时代,由美国证券交易委员会(SEC)依据ABS-EE规则推动的强制披露制度下构建,旨在捕捉BANK 2020-BNK29这一特定商业抵押贷款支持证券(CMBS)交易的全生命周期信息。该数据集记录了自2020年11月至2024年5月间43份申报文件与92个Parquet文件,覆盖超过3.6年的月度贷款绩效数据,为研究CMBS资产池的信用演化、提前偿付行为及结构性风险提供了弥足珍贵的细粒度样本。作为SEC ABS-EE公共数据生态的组成部分,该数据集有力推动了学术界与业界从宏观叙事向微观验证的研究范式转型,尤其在验证结构化金融产品定价模型与压力测试框架方面具有奠基性影响。
当前挑战
该数据集所解决的领域核心挑战在于,传统CMBS市场的信息不对称与资产池的‘黑箱’特性严重阻碍了独立分析与有效监管。首先,投资者以往依赖评级机构或承销商的有限披露,难以获取逐笔贷款的动态表现(如还款状态、利率变动、物业估值),导致信用风险评估粗放且滞后。其次,数据集构建需克服XML附件的异构性与嵌套结构复杂性问题,将43份时间序列申报文件中的非结构化数据标准化为92个紧致的Parquet表格,确保字段连贯性(如reportingPeriodEndingDate的提取)。此外,跨年份的收益率曲线波动、借款主体信用迁移以及法律条款变动(如信托契约修订)等变量间的非线性互动,对多窗格数据对齐与因果推断构成了持续挑战,要求研究者设计精巧的数据清洗与时间序列匹配算法以释放其分析潜力。
常用场景
经典使用场景
在资产支持证券(ABS)领域,BANK 2020-BNK29数据集为学术界与业界提供了一个宝贵的微观视角。该数据集源自美国证券交易委员会(SEC)的ABS-EE(Asset-Level Electronic Filing)系统,完整收录了BANK 2020-BNK29商业抵押贷款支持证券(CMBS)自2020年11月至2024年5月期间共计43次申报的逐笔贷款层面数据。其核心使用场景在于支撑基于资产池细粒度信息的量化分析,研究学者可借此追踪单笔贷款的还款表现、违约或提前偿付行为,从而动态评估结构化产品的信用风险演变路径。数据集以Parquet格式组织,便于高效存储与处理,为构建压力测试模型与现金流预测提供了坚实底座。
实际应用
在实际应用中,BANK 2020-BNK29数据集成为金融机构与评级机构进行投资决策与风控管理的战略资源。借助该数据集,银行能够对其CMBS持仓实施精细化压力测试,模拟不同经济情景下贷款违约率对优先级证券现金流的影响。资产管理公司则利用逐笔贷款的历史表现,优化资产组合的风险对冲策略。同时,监管机构可基于这些标准化披露数据,构建行业基准指标以识别系统性风险苗头,从而提升对影子银行体系的监管有效性。从信贷建模到合规报告,该数据集为连接原始贷款表现与结构化产品市场定价提供了不可替代的事实基础。
衍生相关工作
围绕BANK 2020-BNK29数据集,学术界已衍生出一系列具有影响力的经典工作。早期研究聚焦于利用该数据检验信用评级机构在CMBS评级时是否充分纳入了资产池的集中度风险。随后,有学者将机器学习模型(如随机森林与梯度提升树)应用于该数据,通过训练算法识别提前偿付与违约的关键预测因子,显著改进了传统概率模型的表现。此外,该数据集还催生了关于贷款地域分散性与经济周期关联的深入分析,部分工作构建了动态网络模型以追踪风险在资产池内部的扩散路径。这些衍生成果不仅丰富了实证资产定价的理论体系,也为金融科技在结构化产品领域的应用开创了先河。
以上内容由遇见数据集搜集并总结生成



