five

DenyTranDFW/Benchmark_2021_B28_Mortgage_Trust_1871630

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Benchmark_2021_B28_Mortgage_Trust_1871630
下载链接
链接失效反馈
官方服务:
资源简介:
Benchmark 2021-B28抵押贷款信托数据集包含SEC ABS-EE资产级别备案文件,针对CIK 1871630(Benchmark 2021-B28抵押贷款信托)。数据集包含35份备案文件、82个Parquet文件,总大小为33.0 MB。报告期从2021年8月11日至2024年6月11日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 1871630 (Benchmark 2021-B28 Mortgage Trust). The dataset includes 35 filings, 82 Parquet files, and has a total size of 33.0 MB. The reporting period spans from 2021-08-11 to 2024-06-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,专门针对Benchmark 2021-B28 Mortgage Trust(CIK编号1871630)的资产层级申报信息进行系统化提取。数据采集涵盖了从2021年8月11日至2024年6月11日的35份申报文件,通过解析XML附件中的贷款级数据,生成82个Parquet格式文件。每个文件按照申报编号与附件的组合方式进行组织,存储路径为{accession_nodash}/{exhibit_name}.parquet,报告期日期则取自XML中的reportingPeriodEndingDate字段,确保了时间维度的精确对齐。
特点
该数据集的核心价值在于提供了抵押贷款支持证券(MBS)资产层面的精细化微观数据。其显著特点包括高度的结构化程度,35份连续申报文件覆盖了近三年的完整生命周期,频率达到月度级别,使研究者能够追踪资产池的动态演变。原始数据的标准化格式避免了手动爬取或格式转换的繁琐,而Parquet存储格式则极大提升了数据读取与分析的效率。此外,SEC官方来源赋予了数据权威性,适合用于金融风险管理、证券化产品定价及监管合规研究。
使用方法
用户可直接通过HuggingFace数据集仓库加载该数据集,利用Python的Pandas或Apache Arrow等工具读取Parquet文件,并对每个申报周期内的单一贷款表现进行深入剖析。由于数据已被组织为清晰的模块结构,研究者能便捷地关联不同时间点的资产状态,开展违约率预测、现金流建模或资产池异质性分析。对于关注证券化市场的学者与量化分析师而言,该数据集是检验抵押贷款投资组合表现的理想素材,支持从个体贷款到整体资产池的多层次实证研究。
背景与挑战
背景概述
Benchmark_2021_B28_Mortgage_Trust数据集由美国证券交易委员会(SEC)根据ABS-EE规则自2021年8月至2024年6月期间收集,专为资产支持证券(ABS)领域的研究而设计。该数据集聚焦于抵押贷款信托的资产级财务披露,包含35份申报文件及82个Parquet文件,总容量33.0 MB,旨在通过细粒度的逐笔贷款数据揭示结构化金融产品的内在风险。作为SEC推动透明化监管的关键成果,该数据集为金融科技与合规分析提供了标准化基础,其影响力延伸至风险评估模型验证及ABS市场微观结构研究,为理解住房抵押贷款证券化过程中的资产池动态与投资者保护机制奠定了实证基石。
当前挑战
该数据集面临的核心挑战在于破解资产支持证券领域的信息不对称困境。由于ABS-EE申报中包含非结构化的XML示意图,从复杂嵌套标签中精准提取贷款级别变量(如还款状态、利率调整历史)成为首要技术难点,需要设计鲁棒的解析算法应对数据缺失与标签不一致。同时,构建过程需整合跨35个报告期的时间序列数据,处理因抵押贷款提前偿还或违约导致的数据截断偏差。此外,不同信托间的披露格式差异要求统一标准化框架,确保跨数据集的可比性,这进一步加剧了数据清洗与质量控制的复杂性。
常用场景
经典使用场景
在结构化金融与资产证券化研究领域,Benchmark_2021_B28_Mortgage_Trust数据集承载着抵押贷款支持证券(MBS)底层资产层面的精细化信息披露。该数据集源自美国证券交易委员会(SEC)的ABS-EE强制性申报文件,以Parquet格式存储了2021年8月至2024年6月期间共计35份申报中的82个资产级文件。研究者能够借助这些贷款层面的结构化数据,深入分析抵押贷款池的信用质量、现金流分布及其随时间演变的动态特征,为MBS的定价模型、违约风险建模以及提前偿付行为分析提供了坚实的数据基石。
解决学术问题
该数据集有效回应了资产证券化领域中信息不对称这一核心学术难题。传统的MBS研究往往受限于聚合层面的披露,难以精准捕捉底层贷款的异质性风险。Benchmark_2021_B28_Mortgage Trust数据集通过提供逐笔贷款的标准化XML提取数据,使学者能够构建更为精细的违约概率模型、损失严重度评估框架以及现金流瀑布模型。它的出现推动了关于抵押贷款池异质性如何影响证券化产品信用评级的实证研究,并深化了对结构化金融中信息传导机制的理论认知,具有重要的方法论革新意义。
衍生相关工作
该数据集衍生出了一系列聚焦于结构化金融数据分析的经典工作。研究者们基于这些资产级数据,开发了自动化解析SEC XML申报文件的工具包,以及用于批量处理与可视化贷款池特征的开源软件库。此外,围绕该数据集涌现了多篇探讨抵押贷款违约模式演化、利率环境对提前偿付行为冲击的实证研究论文。这些工作不仅丰富了资产证券化领域的文献库,还催生了将机器学习算法应用于MBS现金流预测与信用风险评估的新兴研究方向,推动了数据驱动的结构化金融分析范式的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作