five

DenyTranDFW/3650R_2021_PF1_Commercial_Mortgage_Trust_1890702

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/3650R_2021_PF1_Commercial_Mortgage_Trust_1890702
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别备案文件,涉及CIK 1890702(3650R 2021-PF1商业抵押贷款信托)。数据集包含41份备案文件,162个Parquet文件,总大小为22.2 MB,报告期为2021年11月12日至2026年2月11日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。数据集还包括一个备案索引表,详细列出了每份备案的CIK、表格类型、登记号、报告日期和URL。

SEC ABS-EE asset-level filings for CIK 1890702 (3650R 2021-PF1 Commercial Mortgage Trust). The dataset includes 41 filings, 162 parquet files, with a total size of 22.2 MB, covering the reporting period from 2021-11-12 to 2026-02-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. The dataset also provides a filing index with details such as cik, form, accessionNumber, reportDate, and url for each filing.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在资产证券化(ABS)领域,详尽且规范的资产层面数据是信用风险分析与市场透明度提升的基石。3650R 2021-PF1 Commercial Mortgage Trust 数据集源自美国证券交易委员会(SEC)的ABS-EE(Asset-Backed Securities Exchange Electronic)系统,旨在为研究者提供结构化的底层资产信息。该数据集通过自动化流程从SEC EDGAR系统中提取CIK代码为1890702的信托实体的ABS-EE归档文件,共涵盖41份申报材料,并进一步解析其中的XML展品文件,最终以Parquet列式存储格式组织为162个独立的资产层面数据文件。每个文件以“accession_nodash/展品名称.parquet”的路径存储,确保文件之间的逻辑关联与可追溯性。数据集的报告周期从2021年11月12日起至2026年2月11日止,完整覆盖该商业抵押贷款信托的生命周期与定期披露要求,为纵向时序研究提供了坚实的数据基础。
特点
该数据集最显著的特点在于其结构性与标准化程度,所有资产层面数据均直接从SEC法定的XML展品中提取,并经由严格解析转换为高效可计算的Parquet格式,大幅提升了海量金融数据的存取与处理效率。数据集包含基金层面与资产层面的多维字段,如报告期截止日期(reportingPeriodEndingDate)等关键时间标识,使得研究者能够精准捕捉各时间点上底层抵押贷款的偿付表现、信用质量变动以及资产组合的演变动态。此外,数据集的归档材料涵盖自2021年至今跨越五年的定期报告,时间序列长度与频率均符合ABS市场分析的高标准要求,有助于开展贷款层面的违约预测、提前偿付建模及信用评级压力测试等深度研究工作。
使用方法
使用该数据集时,研究者可依据SEC提供的统一CIK与accession number进行跨系统关联,与EDGAR原始XML文件及其他公开市场数据实现无缝集成。由于数据以Parquet格式存储,推荐使用Apache Arrow、Pandas(通过pyarrow或fastparquet引擎)或Dask等支持列式读取的库进行加载与分析。针对时间序列分析需求,可通过reportingPeriodEndingDate字段对各申报批次的资产池状态进行切片与纵向对齐。结合数据集中各展品文件命名的规律性与路径结构,用户能够高效地按贷款、属性和时点维度进行筛选、聚合与建模。该数据集尤其适用于需要高频、标准化的资产层面输入数据的信用风险评估、投资组合管理及ABS定价模型等场景。
背景与挑战
背景概述
在资产支持证券(ABS)领域,透明化和标准化数据是提升市场效率与风险监管的核心。3650R 2021-PF1 Commercial Mortgage Trust数据集由SEC ABS-EE项目于2021年11月创建,聚焦于商业抵押贷款支持证券(CMBS)的资产层面信息。该数据集通过解析XML展品,汇总了来自CIK代码1890702的41份ABS-EE归档文件,涵盖162个Parquet文件,总规模22.2 MB,报告期限从2021年11月至2026年2月。其核心研究问题在于提供贷款级别的结构化数据,以支持对CMBS产品现金流、违约风险及资产池多样性的深入分析。作为SEC推动ABS市场信息披露标准化的成果,该数据集对金融研究、监管合规及投资决策具有显著影响,为量化资产池行为与风险建模奠定了数据基础。
当前挑战
该数据集主要解决了商业抵押贷款支持证券领域信息不透明与数据异构性的挑战。具体而言,1)领域问题:CMBS市场长期面临资产级别数据缺失或格式不统一的困境,传统披露方式难以支持精细化风险评估与自动化分析,该数据集通过标准化XML到Parquet的转换,实现了对贷款还款、抵押品特征等关键维度的结构化提取。2)构建挑战:从SEC的EDGAR系统获取原始XML展品需应对多版本归档与复杂嵌套结构,设计稳健的解析流程以兼容不同时期数据格式的变异性;同时确保41份文件时序上的一致性(如报告日期对齐),并在22.2 MB的紧凑容量内平衡数据完整性与存储效率。
常用场景
经典使用场景
在资产证券化(ABS)与结构化金融研究领域,3650R 2021-PF1 Commercial Mortgage Trust 数据集为学者提供了一个精细化的单笔商业抵押贷款支持证券(CMBS)交易层面数据源。其核心价值在于从美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化披露)归档中提取了资产级别的Parquet文件,覆盖从2021年11月至2026年2月长达数年的逐笔贷款月度表现数据。研究者可借此深入剖析商业抵押贷款的违约模式、提前偿付行为以及现金流瀑布分配机制,构建精密的信用风险定价模型和交易结构评估框架。
实际应用
在实际应用中,该数据集是金融机构、风险管理公司与金融科技企业开展商业抵押贷款组合压力测试与尽职调查的得力工具。它可用于训练机器学习模型以预测CMBS各类别资产的信用评级迁移路径,或评估宏观经济冲击(如利率波动与商业地产空置率上升)对特定交易现金流丰裕程度的影响。此外,该数据也辅助监管机构监测系统重要性交易的资产质量演变,及时发现潜在系统性风险,并指导评级机构校准其评级模型中的参数假设。
衍生相关工作
围绕该数据集,学界与业界已衍生出多项开拓性工作。在学术层面,催生了基于该数据训练的商业地产贷款违约预警集成学习模型,以及利用自然语言处理解析非结构化XML备注信息以量化特殊服务机构干预效应的研究。在工程层面,相关工作者开发了自动化数据管道,将Parquet格式的资产水平数据与市场定价数据无缝连接,构建了动态CMBS交易仪表盘。此外,该数据还作为基准测试集,用于比较不同图神经网络架构在捕捉贷款池风险依赖结构时的性能差异。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作