five

DenyTranDFW/BENCHMARK_2022_B35_MORTGAGE_TRUST_1921064

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BENCHMARK_2022_B35_MORTGAGE_TRUST_1921064
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别文件,针对CIK 1921064(BENCHMARK 2022-B35 MORTGAGE TRUST)。数据集包括34份文件,84个Parquet文件,总大小为36.8 MB,报告期从2022年5月11日至2026年2月11日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 1921064 (BENCHMARK 2022-B35 MORTGAGE TRUST). The dataset includes 34 filings, 84 parquet files, with a total size of 36.8 MB, covering a reporting period from 2022-05-11 to 2026-02-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在资产证券化领域,BENCHMARK_2022_B35_MORTGAGE_TRUST_1921064数据集是基于美国证券交易委员会(SEC)的ABS-EE(Asset-Backed Securities Electronic Exhibit)制度构建的。该数据集通过系统性地抓取CIK编号为1921064的信托基金在EDGAR系统中提交的XML附录文件,从中提取贷款级别或资产级别的结构化数据,并将其转换为高效的Parquet格式。数据按照无连字符的存取号(accessionNodash)和附录名称(exhibitName)进行组织,共涵盖34份申报文件,生成84个Parquet文件,时间跨度从2022年5月至2026年2月,报告周期日期直接来源于XML资产级数据的reportingPeriodEndingDate字段。
特点
该数据集展现出鲜明的时序性、精细度和标准化特质。它完整记录了BENCHMARK 2022-B35 MORTGAGE TRUST在近四年间的逐月资产表现,包含从2022年5月11日至2026年2月11日的34个报告节点,为研究抵押贷款支持证券的履约、拖欠与偿付动态提供了连续的时间序列。每个时间点对应SEC官方归档的ABS-EE文件,确保了数据的法律合规性与可比性。此外,数据以Parquet列式存储格式呈现,在大规模分析中兼具高效存取与低存储开销的优势,解决了传统XML文件解析繁琐、处理效率低下的痛点。
使用方法
使用该数据集时,研究者可直接通过数据加载工具(如Pandas或Dask)读取Parquet文件,无需额外解析XML。每个文件路径遵循{accession_nodash}/{exhibit_name}.parquet的命名规范,便于按申报批次或附录类型进行定向索引。数据字段内容包括贷款层面的详细财务与合同信息,可用于构建违约预测模型、评估资产池信用风险或开展压力测试。同时,随附的Filing Index表格提供了CIK、表单类型、报告日期及SEC官方链接,方便用户交叉验证原始申报情境,实现从原始文档到结构化数据的无缝衔接。
背景与挑战
背景概述
BENCHMARK_2022_B35_MORTGAGE_TRUST数据集源于美国证券交易委员会(SEC)强制要求的资产支持证券(ABS)资产级电子化申报(ABS-EE)制度,由BENCHMARK 2022-B35 MORTGAGE TRUST(CIK: 1921064)于2022年5月至2026年2月期间持续披露。该数据集聚焦于住房抵押贷款支持证券(RMBS)领域,旨在通过结构化、标准化的逐笔贷款级数据,解决ABS市场中信息不对称与风险评估透明度的核心问题。作为SEC监管改革下的重要产物,该数据集为金融监管机构、投资者及学术界提供了量化分析抵押贷款池信用风险、提前偿付行为及违约模式的珍贵素材,有力推动了结构化金融产品定价模型与系统性风险预警研究的深化。
当前挑战
该数据集面临的核心挑战在于将非标准化的XML格式资产级数据转化为可解析的Parquet文件过程中,需处理各异购档中的字段命名歧义、缺失值填充及日期格式统一等难题。此外,数据集所解决的领域问题在于克服传统ABS信息披露中仅提供聚合级数据导致的底层资产风险黑箱化,使得研究人员能够逐笔追踪贷款表现,但仍需应对数据中潜在的编码误差、多期数据间的一致性校验,以及因披露格式变动引发的跨期可比性降低等构建过程与底层分析中的双重挑战。
常用场景
经典使用场景
BENCHMARK_2022_B35_MORTGAGE_TRUST数据集作为资产支持证券(ABS)领域内标准化的资产级数据资源,其经典使用场景聚焦于抵押贷款支持证券(MBS)的信用风险建模与现金流预测。研究人员可借助该数据集涵盖的34份SEC ABS-EE阶段定期申报文件与84个Parquet文件中的逐笔贷款明细,回溯特定信托产品从2022年至2026年的完整资产表现轨迹。这些颗粒度数据为构建违约概率、损失强度及提前偿还模型提供了坚实的基础,从而支撑起对证券分层结构的估值与敏感性分析。
解决学术问题
在学术研究中,该数据集着力破解因信息不对称导致的资产支持证券定价偏差与风险误估问题。通过提供CIK 1921064信托下标准化且经监管备案的资产层级信息,它使得研究者能够穿透传统评级指标,从微观层面论证贷款池的异质性如何影响证券的信用增级机制与预期损失分布。这一透明的数据基础设施不仅促进了结构金融领域理论模型的实证检验,还推动了对2008年金融危机后资产证券化监管改革效果的量化评估,深刻影响了金融稳定性分析的研究范式。
衍生相关工作
以此数据集为核心,一系列衍生工作已在结构化金融与机器学习交叉领域涌现。一方面,研究者利用其时序数据特性,开发了基于Transformer架构的现金流预测模型,以替代传统随机微分方程方法,显著提升了尾部风险捕获能力。另一方面,该数据集催生了多层图神经网络在ABS网络风险传导分析中的应用,通过建模贷款与证券层级间的隐匿关联来识别系统性风险节点。此外,以该数据集为基准的还包含对SEC ABS-EE披露规范质量的比较研究,推动了国际证券监管机构间的数据标准化对话。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作