DenyTranDFW/Wells_Fargo_Commercial_Mortgage_Trust_2021_C61_1891774
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Wells_Fargo_Commercial_Mortgage_Trust_2021_C61_1891774
下载链接
链接失效反馈官方服务:
资源简介:
该数据集涉及美国证券交易委员会(SEC)ABS-EE资产级别文件,具体为CIK 1891774(Wells Fargo Commercial Mortgage Trust 2021-C61)的相关数据。包含39份文件,98个Parquet文件,总大小为5.0 MB,报告期从2021年12月11日至2026年2月11日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。
SEC ABS-EE asset-level filings for CIK 1891774 (Wells Fargo Commercial Mortgage Trust 2021-C61). Includes 39 filings, 98 parquet files, with a total size of 5.0 MB, covering the reporting period from 2021-12-11 to 2026-02-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化)强制披露制度,聚焦于富国银行商业抵押信托2021-C61(Wells Fargo Commercial Mortgage Trust 2021-C61)这一特定资产支持证券产品。数据集通过系统化采集CIK编号为1891774的实体在SEC EDGAR系统上提交的39份ABS-EE表格构建而成。每份表格中的资产级XML附件被解析并转换为Parquet格式文件,共计98个文件,按访问号与展品名称的组织结构进行存储,确保数据提取的标准化与可追溯性。报告期间跨度从2021年12月11日至2026年2月11日,覆盖了该信托产品完整的生命周期数据。
特点
该数据集的核心特点在于其精细化的逐笔贷款粒度与持续化的时间序列属性。与传统的汇总式资产支持证券数据不同,此数据集提供了每笔商业抵押贷款的详细资产层面信息,包括贷款余额、利率、还款状态等关键指标,使研究者能够深入剖析底层资产池的信用风险与现金流表现。数据集的时间序列涵盖超过50个月份,形成了连续的观测窗口,支持基于面板数据的纵向分析。此外,其完全基于SEC官方提交文件,确保了数据的权威性与合规性,且Parquet格式的高效压缩与列式存储特性,使得约5MB的体量能够承载丰富的信息密度。
使用方法
用户可通过编程语言(如Python)中的Pandas库直接读取Parquet文件,利用`pd.read_parquet()`快速加载数据,并借助文件路径中的`accession_nodash`与`exhibit_name`进行分表索引。对于完整的资产层面分析,建议将98个文件合并成单一DataFrame,以`reportingPeriodEndingDate`字段作为时间标识,构建面板数据结构。数据集的GPL许可协议允许自由使用与修改,但需保留原始版权声明。典型应用场景包括商业抵押贷款违约预测模型训练、资产证券化产品的现金流压力测试,以及金融监管合规性研究。
背景与挑战
背景概述
资产证券化(ABS)作为现代金融体系中的重要融资工具,其底层资产信息的透明度与标准化程度直接影响着市场定价效率与风险管控能力。针对商业抵押贷款支持证券(CMBS)领域,美国证券交易委员会(SEC)通过ABS-EE规则要求发行人披露逐笔资产级别的详细数据。Wells Fargo Commercial Mortgage Trust 2021-C61数据集正是基于这一监管框架构建,由SEC EDGAR系统收录的CIK 1891774实体申报材料整理而成。该数据集涵盖自2021年12月至2026年2月的39份申报文件,共98个Parquet格式的资产级数据文件,总容量约5.0 MB。这些数据源自XML附件的逐笔贷款信息,经结构化处理后形成标准化字段,为量化分析商业抵押贷款组合的信用质量、现金流分布与违约风险提供了高颗粒度的基础研究资料,在金融科技与结构化产品实证研究领域具有重要价值。
当前挑战
该数据集主要应对两大层面的挑战。在领域问题层面,商业抵押贷款证券化市场长期面临资产信息不对称困境:传统披露方式仅为汇总层面的静态数据,无法支撑对底层抵押物逐笔贷款的动态风险建模,导致投资者难以准确评估贷款逾期率、提前偿付率及抵押物估值波动等关键指标。在构建过程层面,原始SEC申报文件中的XML附件包含大量非标准化标签与嵌套结构,不同申报期的字段命名规则存在差异,贷款级数据的时间序列对齐与缺失值处理成为技术难点;同时,数据集需跨越5年报告周期,期间可能涉及贷款修改、抵押物处置等事件,这些动态变化在原始XML中表现为碎片化信息,需要编写定制化解析逻辑才能实现资产状态演变的完整追踪。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,Wells Fargo Commercial Mortgage Trust 2021-C61数据集扮演着基石角色。该数据集源自美国证券交易委员会(SEC)的ABS-EE强制披露规则,汇集了富国银行商业抵押贷款信托在2021年至2026年间多达39份监管备案文件,并以Parquet格式存储了98个贷款级资产明细表。其经典使用场景在于为金融学者提供结构化、机器可读的资产池微观数据,支撑对商业抵押贷款支持证券(CMBS)的逐笔贷款风险画像、现金流建模及证券化产品定价等深度量化分析。研究人员可借助这些高频报送的资产层面信息,追踪每个标的物业的还款表现、地理分布与贷款特征,从而构建更为精细的违约预测与信用评级模型。
实际应用
在现实金融世界中,该数据集转化为风险管理和投资决策的有力工具。资产管理公司与评级机构可以将其作为基准,比对自有CMBS投资组合的偿付表现,动态监控商业地产周期的波动对信托资产质量的冲击。对于量化交易团队而言,历史贷款表现数据是构建信用利差预测模型与反向压力测试的输入燃料。同时,该数据也赋能金融科技公司开发先进的资产池可视化分析平台,帮助非机构投资者穿透复杂的证券化结构,识别不同优先级证券的真实信用风险敞口。在监管科技领域,信息技术部门可利用这些结构化数据自动核对发行人的合规报送,提升市场监控的数字化水平。
衍生相关工作
围绕该数据集衍生了多个方向的研究工作。在资产定价方向,有学者利用其贷款级数据校准了包含提前偿付与违约风险的结构化模型,重新审视了CMBS利差定价的合理性。在金融中介理论方向,衍生工作深入分析了发行人保留权益份额与资产池筛选质量之间的内生关系,为道德风险理论提供了新的微观证据。此外,数据本身的结构化特性(Parquet格式)推动了金融自然语言处理领域的创新,研究者尝试将XML展品中的非结构化文本描述与数值字段融合,训练能够自动提取关键风险信号的语言模型。大数据专家还基于该数据集的时序特征,开发了适用于证券化产品的异常检测算法,用以识别服务商报告中可能存在的粉饰行为。
以上内容由遇见数据集搜集并总结生成



