five

DenyTranDFW/BANK_2021_BNK36_1880921

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BANK_2021_BNK36_1880921
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集涉及美国证券交易委员会(SEC)ABS-EE资产级别文件,针对CIK 1880921(BANK 2021-BNK36)。包含33份文件,68个Parquet文件,总大小为4.9 MB,报告期为2021年10月12日至2024年6月11日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 1880921 (BANK 2021-BNK36). Includes 33 filings, 68 parquet files, total size of 4.9 MB, and a reporting period from 2021-10-12 to 2024-06-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,聚焦于中央索引键(CIK)为1880921的BANK 2021-BNK36资产支持证券发行实体。数据集的构建基于对申报期间(自2021年10月12日至2024年6月11日)内提交的33份ABS-EE备案文件的系统性收集与解析,从中提取出68个Parquet格式的贷款级/资产级数据文件。这些结构化数据来源于XML展品附件,并按照“存取号(去连字符)/展品名称.parquet”的目录结构进行组织,确保了数据来源的可追溯性与组织的有序性。
特点
该数据集的核心特点在于其时间序列的连贯性与微观层面的精细度。涵盖了长达近三年的申报周期,并且每月均有持续的资产表现数据更新,为分析资产池的绩效演变提供了高频率的时间断面。数据以Parquet列式存储格式呈现,不仅大幅提升了数据压缩率与查询效率,还保留了从原始XML中提取的完整字段信息,尤其包含关键的报告期结束日期(reportingPeriodEndingDate)。整个数据集结构清晰、元数据完备,便于进行大规模金融数据分析与模型构建。
使用方法
用户可通过数据集的存取号索引便捷地定位与加载数据。每个Parquet文件可借助支持该格式的数据分析工具(如Python的Pandas库)直接读取,通过指定相应的存取号与展品名称路径即可实现单个备案文件内资产级数据的提取。该数据集还提供了一份详尽的归档索引表,列示了每一份ABS-EE申报的CIK、表格类型、存取号、报告日期及SEC官网链接,用户可据此进行数据溯源、验证或补充下载,从而灵活支撑针对BANK 2021-BNK36资产支持证券的深入量化研究。
背景与挑战
背景概述
资产支持证券(ABS)作为结构化金融产品,其风险定价高度依赖于底层资产池的动态表现。SEC ABS-EE(Asset-Backed Securities - Electronic Exhibits)制度要求发行人提交标准化资产级数据,以提升市场透明度。BANK_2021_BNK36_1880921数据集正是源于这一监管框架,由SEC EDGAR系统收录,覆盖CIK代码1880921对应的“BANK 2021-BNK36”资产支持证券项目。该数据集创建于2021年10月12日至2024年6月11日期间,包含33份ABS-EE申报文件,以Parquet格式存储68个资产级数据文件,总规模约4.9 MB。数据集聚焦于商业抵押贷款支持证券(CMBS)的逐笔贷款数据,通过XML附件提取结构化字段(如报告期末日期),为量化违约风险、提前偿付行为及现金流建模提供标准化基础。作为SEC强制披露的公共数据产品,其结构化特性推动了金融科技领域对ABS资产池透明度的研究与监管套利检测的实证分析。
当前挑战
该数据集面临的核心挑战在于资产级数据的异质性与一致性。首先,商业抵押贷款本身的非标准化特性使得不同发行人的数据字段定义存在差异,即便在同一ABS交易中,贷款类型(如固定利率与浮动利率)、摊销结构及抵押品评估方法也可能各异,导致跨数据集比较与聚合分析时需进行繁复的字段映射与语义对齐。其次,构建过程中的挑战源于XML解析的复杂性:原始EDGAR文件中,资产级数据嵌入在非结构性XML附件中,关键字段如利率重置日期、贷款余额及还款状态可能嵌套于多层级标签下,且部分文件存在缺失值或编码错误,需设计健壮的提取逻辑以防止信息丢失。此外,数据量虽小(4.9 MB)但时间跨度达33个月,月度申报频率要求维护连贯的时序链,以应对漏报或迟报导致的断点问题,这对现金流模型的稳定性构成潜在威胁。
常用场景
经典使用场景
在资产支持证券(ABS)领域,BANK 2021-BNK36数据集为研究者提供了详尽的资产层面披露信息,涵盖从2021年10月至2024年6月的33份ABS-EE申报文件。该数据集的经典使用场景包括对商业抵押贷款支持证券(CMBS)底层资产池的微观结构分析,例如追踪单笔贷款的还款表现、违约率演变以及提前偿还行为。研究者可利用其存储为Parquet格式的标准化贷款级数据,构建时间序列模型来评估资产池的信用风险动态,或比较不同申报周期内资产质量的变化趋势。此外,通过解析XML附表中的报告期结束日期,还能精确刻画宏观经济事件对抵押品表现的影响,为结构化金融产品的定价与评级提供实证基础。
衍生相关工作
基于BANK 2021-BNK36数据集已衍生出一系列标志性学术工作。在信贷风险建模领域,有学者利用其贷款级数据改进了经典的Merton违约模型,通过引入时间变化的资产波动率参数,更准确地拟合了商业地产抵押品的违约模式。另一些研究者则聚焦于证券化结构中的优先级瀑布机制,基于该数据构建了现金分配顺序的回溯模拟框架,揭示了特定交易中超额利差如何因底层资产违约而被侵蚀。此外,数据集中严格的申报日期标识催生了关于信息及时性的研究——例如分析月度报告的滞后期是否影响市场对风险的定价效率。这些工作不仅深化了对ABS产品内在脆弱性的理解,也为SEC后续修订ABS-EE披露标准提供了实证依据。
数据集最近研究
最新研究方向
在资产支持证券(ABS)领域,BANK_2021_BNK36_1880921数据集聚焦于SEC ABS-EE框架下商业银行资产池的逐笔贷款级信息披露,其包含的33份申报文件和覆盖2021至2024年的报告周期,为分析结构化金融产品的信用风险演变、现金流表现及透明度监管提供了珍贵样本。当前前沿研究正利用此类细粒度数据,结合机器学习模型预测违约概率与早偿行为,并探究后疫情时代商业地产抵押贷款支持证券(CMBS)的资产池异质性对市场定价的影响。该数据集的出现推动了ABS市场从静态评级向动态风险评估的范式转变,呼应了SEC强化资产级数据标准化的监管热点,对提升金融系统韧性、优化投资者决策具有里程碑式的实践意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作