DenyTranDFW/Benchmark_2021_B25_Mortgage_Trust_1851115
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Benchmark_2021_B25_Mortgage_Trust_1851115
下载链接
链接失效反馈官方服务:
资源简介:
该数据集涉及美国证券交易委员会(SEC)ABS-EE资产级别备案,具体针对CIK 1851115(Benchmark 2021-B25 Mortgage Trust)。包含41份备案文件,159个Parquet文件,总大小为39.0 MB,报告期为2021年4月12日至2024年7月11日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。
SEC ABS-EE asset-level filings for CIK 1851115 (Benchmark 2021-B25 Mortgage Trust). Includes 41 filings, 159 parquet files, with a total size of 39.0 MB, covering the reporting period from 2021-04-12 to 2024-07-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
Benchmark_2021_B25_Mortgage_Trust数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化归档)系统,集中收录了CIK编号为1851115的信托实体从2021年4月至2024年7月间的41份监管申报文件。每一份申报均通过解析XML展品中的贷款级或资产级数据生成Parquet格式文件,并以{accession_nodash}/{exhibit_name}.parquet的结构化目录进行组织。报告周期时间明确取自资产级XML内的reportingPeriodEndingDate字段,共计形成159个Parquet文件,总容量达39.0 MB,确保了数据颗粒度与可追溯性的平衡。
特点
该数据集的核心特色在于其高度的结构化与精细化,完整覆盖了基准抵押贷款信托在三年多期间的逐笔贷款动态。每份文件忠实还原了ABS-EE申报中的原始资产级信息,为研究者提供了连续的时序截面数据,便于追踪贷款绩效、信用风险及现金流变化。通过统一的Parquet格式存储,数据集在压缩效率与查询性能上表现优异,同时保留了SEC官方申报的元数据(如访问编号、报告日期等),为金融实证分析、模型验证及监管合规研究奠定了坚实的数据基础。
使用方法
用户可直接利用Python等工具中的Parquet读取库(如pandas的read_parquet函数)加载数据,按目录路径或全局模式批量导入所有文件。每条记录对应特定申报期下的单一贷款,通过合并不同时间点的资产端快照,可构建面板数据结构。对于需要跨期分析的情景,推荐依据accessionNumber或reportDate字段关联各期文件,从而追踪同一贷款池的时间演变。建议在使用前参考SEC的ABS-EE技术规范,以准确解读字段含义并规避兼容性问题。
背景与挑战
背景概述
在资产证券化(ABS)领域,透明化与标准化监管数据的获取一直是研究与实践的痛点。Benchmark 2021-B25 Mortgage Trust数据集正是在此背景下应运而生,它由SEC(美国证券交易委员会)的ABS-EE(资产支持证券-电子化存档)项目推动,专注于CIK编号1851115对应的抵押贷款信托实体。该数据集创建于2021年4月,涵盖至2024年7月的监管备案信息,共收录41份ABS-EE申报文件及159个Parquet格式的资产级数据文件,由金融数据社区与监管机构协同整理。其核心研究问题在于揭示抵押贷款支持证券(MBS)在存续期内逐笔贷款的绩效表现与风险演化,为量化分析结构化产品的信用风险、提前偿付行为与市场定价提供了底层数据基石,对实证资产定价、金融监管合规及投资组合管理领域产生了重要影响。
当前挑战
数据集所应对的领域挑战在于,传统ABS市场信息高度不对称,投资者难以从分散的XML申报文件中高效提取标准化的贷款级数据,从而制约了风险定价与违约预警模型的精确性。具体而言,构建过程中需克服多重障碍:一是数据清洗的复杂性,原始XML中时间字段(如reportingPeriodEndingDate)需统一格式并跨文件对齐;二是跨文件关联的困难,41份备案报告通过accessionNumber与URL链接,而资产数据分散于159个Parquet文件,需建立索引体系以追踪单一贷款在存续期内的状态变迁;三是监管文档的版本控制,如2021-10-12的修正案(ABS-EE/A)表明同一报告期存在修订,处理此类重复与冲突数据需审慎的合并策略。此外,39MB的压缩数据在实时分析场景下对计算资源与查询效率提出了额外要求。
常用场景
经典使用场景
在资产证券化研究领域,Benchmark_2021_B25_Mortgage_Trust数据集为学者提供了一扇洞察住宅抵押贷款支持证券(RMBS)底层资产表现与信用风险的窗口。该数据集的核心价值在于其精细的单笔贷款层面数据,涵盖了从2021年至2024年间长达39个月的资产绩效信息。经典应用场景包括构建抵押贷款提前偿付模型与违约概率预测模型,通过逐月跟踪每笔贷款的还款状态与逾期情况,研究者能够精确刻画贷款池的动态行为,并评估宏观经济波动对证券化资产现金流的影响。
解决学术问题
该数据集直面金融学术研究中信息不对称与模型验证的痛点,解决了传统研究中难以获取标准化的资产层面结构化数据的难题。通过SEC要求的ABS-EE合规申报,研究者得以突破原始贷款数据零散且非公开的壁垒。这一数据集的公开化支持了抵押贷款违约风险建模的基准测试,削弱了第三方评级机构在信息获取上的垄断地位,推动了更透明、可复现的信用风险评估框架建立,对促进结构化金融产品的科学定价与风险度量具有里程碑式的意义。
衍生相关工作
围绕Benchmark_2021_B25_Mortgage_Trust数据集衍生了一系列开创性研究,例如基于机器学习的抵押贷款提前支付风险因子发现,以及对比不同池化策略对RMBS层内信用分层效率的影响。在深度学习领域,研究者利用其时间序列结构开发了基于图神经网络的资产相关性网络模型,用于模拟贷后事件传导效应。此外,该数据还催生了多个针对ABS-EE申报信息披露质量评估的基准工作,推动了FinTech领域对监管金融文本与结构化表格数据的联合分析范式的发展。
以上内容由遇见数据集搜集并总结生成



