five

DenyTranDFW/Benchmark_2022_B36_Mortgage_Trust_1927678

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Benchmark_2022_B36_Mortgage_Trust_1927678
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集涉及美国证券交易委员会(SEC)ABS-EE资产级别文件,针对CIK 1927678(Benchmark 2022-B36 Mortgage Trust)。数据集包含31份文件,78个Parquet文件,总大小为17.4 MB,报告期为2022年8月11日至2026年2月11日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 1927678 (Benchmark 2022-B36 Mortgage Trust). The dataset includes 31 filings, 78 parquet files, with a total size of 17.4 MB, covering the reporting period from 2022-08-11 to 2026-02-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organized as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集围绕Benchmark 2022-B36 Mortgage Trust(CIK编号1927678)构建,专注于美国证券交易委员会(SEC)ABS-EE(资产支持证券电子化)格式的资产层面申报文件。数据集共收录31份申报文件,生成78个Parquet文件,总容量达17.4 MB。数据来源于XML附件的逐笔贷款或资产级信息,以申报编号去除连字符后的文件夹与展品名称的组合方式进行组织,例如{accession_nodash}/{exhibit_name}.parquet。报告期起止日期从资产级XML中的reportingPeriodEndingDate字段提取,覆盖时段为2022年8月11日至2026年2月11日,保障了时间序列的完整性与连续性。
特点
该数据集的核心特点在于其精细的资产层级结构与明确的报告周期标识。每个Parquet文件对应特定申报事件下的独立展品,使得研究者能够精准聚焦于特定时间点的抵押贷款池构成。数据时间跨度长达近四年,包含31个申报时间节点,反映了从发行初期至存续期结束的完整生命周期。此外,数据集遵循SEC的ABS-EE监管标准,既确保了合规性,又强化了与公开市场的可比性。所有文件均以高效的Parquet格式存储,显著压缩了存储空间,同时支持快速列式访问与并行处理,适合大规模金融数据分析。
使用方法
用户可通过加载指定路径下的Parquet文件来启动分析,每个文件代表某一展品在特定申报日期下的资产详情。推荐使用Pandas或PySpark等支持列式存储的数据处理框架,利用其内建的Parquet读取方法实现高效检索。数据集的日期信息已通过reportingPeriodEndingDate字段嵌入,支持按时间维度进行切片或聚合。结合提供的申报索引表格,用户可根据cik、form、accessionNumber、reportDate及url字段追溯原始SEC归档,便于交叉验证。适用于构建抵押贷款表现模型、现金流预测或资产池分层研究等场景。
背景与挑战
背景概述
Benchmark_2022_B36_Mortgage_Trust数据集由美国证券交易委员会(SEC)依据ABS-EE(资产支持证券数据提取与交换)规则创建,旨在提升资产支持证券(ABS)市场的透明度。该数据集聚焦于Benchmark 2022-B36 Mortgage Trust(CIK 1927678),自2022年8月至2026年2月期间,收录了31份ABS-EE备案文件,涵盖78个Parquet格式的贷款级节点数据,总容量达17.4 MB。其核心研究问题在于通过标准化XML附件的结构化提取,为金融监管、风险评估及学术研究提供高质量的时序资产信息,推动ABS市场的数据驱动分析,对金融科技与证券化领域具有重要影响。
当前挑战
该数据集所解决的领域问题包括资产支持证券信息不透明导致的风险定价困难与市场监管低效,通过提供细粒度贷款级数据,助力信用评级、违约预测及现金流模型构建。构建过程中面临的挑战涉及从SEC EDGAR系统海量非结构化XML中精准抽取与解析资产数据,确保跨备案文件的字段一致性,以及处理长跨度(约3.5年)的时序数据整合。此外,数据格式(Parquet)与公开访问策略需兼顾存储效率与易用性,满足不同研究者的应用需求。
常用场景
经典使用场景
在资产证券化研究领域,Benchmark_2022_B36_Mortgage_Trust数据集为学者提供了从美国证券交易委员会ABS-EE备案文件中提取的逐笔贷款级别数据。该数据集包含31份备案、78个Parquet文件,覆盖2022年至2026年的报告期间,完整记录了抵押贷款信托的资产层面信息。经典使用场景包括利用这些细粒度数据构建抵押贷款违约预测模型,或分析资产池的异质性对信用评级的影响。研究者可通过贷款层面的还款记录、利率特征等字段,深入剖析结构化金融产品的风险传导机制。
衍生相关工作
该数据集衍生出的相关工作主要集中在结构化金融与机器学习交叉领域。经典工作包括基于梯度提升树构建的抵押贷款违约预测框架,以及利用图神经网络建模资产池关联性风险的研究。部分学者借鉴该数据开发了ABS现金流模拟器,用于压力测试场景下的损失分布估算。此外,由该数据驱动的可解释性分析研究,通过SHAP值揭示了贷款规模、地域分布等特征对信用风险的边际贡献,推动了透明化风险管理方法论的发展。
数据集最近研究
最新研究方向
在资产证券化领域,Benchmark_2022_B36_Mortgage_Trust数据集聚焦于抵押贷款支持证券(MBS)的精细化风险建模与透明度提升。伴随2022年以来美国利率环境剧烈波动及商业地产市场承压,该数据集通过SEC ABS-EE合规框架下的资产级月度披露,为研究者提供了涵盖还款表现、提前偿付率及违约动态的高频面板数据。前沿方向集中于利用机器学习解析贷款池异质性,构建压力测试下的现金流瀑布模型,并探索ESG因子对抵押物估值的影响。该数据集的时序跨度(2022-2026年)恰好覆盖了美联储加息周期与潜在信贷周期拐点,其单笔贷款级粒度使得研究能从宏观经济冲击向微观个体行为传导的机制进行解构,对理解结构化金融产品的系统性风险敞口具有重要实证价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作