five

DenyTranDFW/BMO_2022_C1_Mortgage_Trust_1903688

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BMO_2022_C1_Mortgage_Trust_1903688
下载链接
链接失效反馈
官方服务:
资源简介:
BMO 2022-C1抵押贷款信托数据集包含SEC ABS-EE资产级别备案,涉及CIK 1903688。数据集包含36份备案文件,98个Parquet文件,总大小为53.1 MB,报告期从2022-02-11至2026-02-11。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 1903688 (BMO 2022-C1 Mortgage Trust). The dataset includes 36 filings, 98 Parquet files, with a total size of 53.1 MB, covering the reporting period from 2022-02-11 to 2026-02-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
BMO_2022_C1_Mortgage_Trust_1903688数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,专为CIK编号1903688的BMO 2022-C1 Mortgage Trust构建。该数据集通过系统化采集该信托在2022年2月至2026年2月期间提交的36份ABS-EE申报文件,并从中提取XML格式的贷款层面资产数据。每个申报文件中的资产级XML附件被解析并转换为Parquet格式文件,文件按申报接入号去除连字符后作为目录名,以附件名称作为文件名进行组织,最终集成为98个Parquet文件和53.1 MB的数据总量,覆盖了完整的申报周期。
特点
数据集的核心特点在于其精细的贷款层面信息粒度与标准化结构化框架。所有数据均源自SEC官方申报的XML格式资产级数据,确保了来源的权威性与合规性。通过Parquet列式存储格式,数据集在高效压缩与查询性能上表现出色,尤其适合大规模金融数据分析。时间跨度上,数据集覆盖了从2022年2月11日至2026年2月11日的完整报告期,包含36个申报时点的逐月记录,为研究抵押贷款信托的资产表现、现金流动态及信用风险演变提供了连续且可靠的时间序列基础。
使用方法
使用该数据集时,可通过HuggingFace平台直接加载Parquet文件,或利用Pandas、Dask等Python数据处理库进行流式读取与分析。每个Parquet文件对应特定申报日期下的单一XML附件内容,用户可根据文件命名规则(如`{accession_nodash}/{exhibit_name}.parquet`)定位所需数据。结合SEC提供的申报索引(包含CIK、申报表单类型、报告日期及官方URL),可轻松回溯原始申报文档进行交叉验证。推荐在金融风险建模、资产证券化绩效评估或监管合规研究中,将此数据集作为底层资产细粒度数据的主干进行整合分析。
背景与挑战
背景概述
该数据集聚焦于资产支持证券(ABS)领域,特别是抵押贷款支持证券的透明化与结构化分析。BMO_2022_C1_Mortgage_Trust数据集由加拿大蒙特利尔银行(BMO)于2022年发起,其核心研究问题在于通过美国证券交易委员会(SEC)的ABS-EE(资产级数据电子化申报)系统,系统性地采集并组织抵押贷款信托的逐笔贷款级数据。数据集覆盖2022年至2026年的36份申报文件,以Parquet格式存储,总计53.1 MB,为金融科技与风险管理研究提供了高颗粒度的结构化样本。作为SEC强制披露要求下的产物,该数据集推动了ABS市场标准化数据基础设施的建立,对于解析抵押贷款池的信用风险、现金流分布及违约模式具有开创性意义,显著提升了次级市场资产定价与监管监测的精准度。
当前挑战
数据集的构建与利用面临双重挑战。首先,在领域问题层面,ABS市场长期受困于信息不对称,投资者难以穿透复杂的结构化产品层级获取底层资产细粒度数据,而该数据集虽然提供了贷款级信息,但如何从海量、异构的XML展品中高效提取并整合标准化字段,进而用于预测贷款违约概率、评估抵押物价值波动对证券化产品的影响,仍是亟待破解的难题。其次,在构建过程中,数据采集需跨越SEC EDGAR系统频繁更新的文件格式与索引结构,同时确保36份申报文件在时间序列上的连续性;此外,将非结构化XML展品转化为Parquet格式时,必须处理缺失值、数据类型不一致及多层级嵌套结构的映射问题,这增加了数据清洗与质量控制的复杂性。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,BMO_2022_C1_Mortgage Trust数据集为学术界和业界提供了宝贵的逐笔贷款级微观数据。其经典使用场景聚焦于抵押贷款支持证券(MBS)的现金流分析与违约风险建模。研究者通过解析该数据集收录的36份ABS-EE监管申报文件、98个Parquet文件,能够精准追踪每笔贷款的还款时序、提前偿付行为与逾期状态变化,从而构建更为精细的现金流瀑布模型。此外,该数据涵盖2022年至2026年的完整报告周期,为分析利率波动环境下抵押贷款池的信用表现提供了纵向基准,尤其适用于评估宏观经济冲击对底层资产组合的传导效应。
解决学术问题
该数据集有效解决了资产证券化领域长期面临的底层资产信息不透明问题。传统研究中,学者常因缺乏标准化的逐笔贷款数据而难以验证信贷风险模型的有效性。借助BMO 2022-C1 Mortgage Trust提供的结构化Parquet文件,研究人员能够精确测量抵押贷款池的异质性风险暴露,并量化证券化产品信用增级机制与损失分摊规则的实际效果。这一资源显著推动了结构化金融理论的发展,尤其是在资产池相关性建模、违约传染路径模拟及提前偿付期权定价等前沿议题上,为实证检验经典金融理论提供了严谨的数据基础。
衍生相关工作
基于该数据集的衍生研究工作主要集中于机器学习驱动的信用风险评估与自然语言处理在金融文本分析中的应用。例如,学者利用Parquet文件中的结构化贷款属性,结合梯度提升模型(如XGBoost)预测贷款违约概率,并与传统Logistic回归模型形成对比。此外,部分工作尝试将ABS-EE申报文件中的XML摘要与宏观经济指标融合,构建多模态预测框架。在算法交易方面,研究人员通过解析资产池的提前偿付速率,设计基于强化学习的动态投资组合再平衡策略。这些衍生探索不仅拓展了结构化金融数据的分析边界,也为金融科技领域的创新应用提供了实证支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作