five

DenyTranDFW/BENCHMARK_2021_B27_MORTGAGE_TRUST_1862080

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BENCHMARK_2021_B27_MORTGAGE_TRUST_1862080
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集涉及BENCHMARK 2021-B27 MORTGAGE TRUST(CIK 1862080)的SEC ABS-EE资产级别申报文件。包含38份申报文件、86个Parquet文件,总大小为76.0 MB,报告期为2021年6月11日至2024年5月13日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。数据集还包括一个申报索引,详细列出每份申报的CIK、表格类型、登记号、报告日期和URL。

SEC ABS-EE asset-level filings for CIK 1862080 (BENCHMARK 2021-B27 MORTGAGE TRUST). Includes 38 filings, 86 parquet files, total size of 76.0 MB, and a reporting period from 2021-06-11 to 2024-05-13. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. The dataset also includes a filing index with details such as cik, form, accessionNumber, reportDate, and url for each filing.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦于资产支持证券(ABS)领域,以BENCHMARK 2021-B27 MORTGAGE TRUST为对象,系统整理了其向美国证券交易委员会(SEC)提交的ABS-EE资产层面申报文件。数据构建过程中,从XML附件中提取了贷款级别或资产级别的详细信息,并将其转换为Parquet格式文件。每个Parquet文件以“访问号(去连字符)/附件名称”的组织形式存放,共计86个文件,覆盖了从2021年6月11日至2024年5月13日的38份申报记录。同时,数据集附带了包含中央索引键(CIK)、表格类型、访问号、报告日期及SEC原始链接的详细索引表,便于用户追溯和核对。
特点
本数据集具有鲜明的结构化与时效性特征。所有资产层级的数据均以高效的Parquet格式存储,便于大规模数据处理与分析。其涵盖的时间跨度达近三年,支持对抵押贷款信托的长期表现进行追踪。此外,数据集明确标注了申报中的修订版本(如ABS-EE/A),反映了信息披露的更新与修正过程。整体而言,该数据为研究资产支持证券的信用风险、现金流表现及监管合规性提供了标准化的、颗粒度精细的素材。
使用方法
用户可通过直接加载Parquet文件来调用数据,利用Python中的Pandas或PyArrow等库进行高效读取与分析。每个文件对应一个特定的申报附件,用户可根据索引表中的访问号定位所需文件。此外,数据集中提供的报告截止日期可用于构建时间序列分析,而SEC官网的超链接则便于验证原始文件。对于需要批量处理的研究场景,可编写脚本遍历所有Parquet文件,提取各申报周期内的资产级字段,以支持风控建模、违约率计算或资产池异质性分析等深度应用。
背景与挑战
背景概述
资产证券化(ABS)作为现代金融市场的核心工具,其透明度与数据可获取性对于风险定价与市场监管至关重要。BENCHMARK_2021_B27_MORTGAGE_TRUST数据集由美国证券交易委员会(SEC)根据ABS-EE规则强制披露的资产级数据整理而来,聚焦于CIK编号1862080对应的抵押贷款信托产品。该数据集创建于2021年6月至2024年5月期间,涵盖了38份监管申报文件、86个Parquet格式的底层贷款级数据文件,总容量达76.0 MB。其核心研究问题在于通过标准化披露格式,为金融分析、违约风险建模及证券化市场研究提供精确的逐笔贷款信息。该数据集成为连接监管合规与学术探索的桥梁,有助于推动对抵押贷款支持证券(MBS)表现与系统性风险的深度理解。
当前挑战
该数据集所应对的领域挑战在于,资产证券化市场中信息披露的非结构化与碎片化长期阻碍着有效风险评估。传统上,投资者和分析师需手动爬取SEC EDGAR系统中的XML附件,但不同信托产品的数据格式与标签标准参差不齐,导致跨产品比较与聚合分析困难重重。在构建过程中,面临的核心挑战包括:从海量税务申报中精准提取资产级数据,并将异质的XML字段映射为统一的Parquet表格结构;处理文件修改(如'/A'后缀表明的修正申报),确保版本控制与数据一致性;此外,各申报文件中的报告截止日期(reportingPeriodEndingDate)需被准确识别与校验,以构建连贯的时间序列数据。这些技术壁垒要求自动化流程具备高度的鲁棒性,方能支撑后续的金融建模与分析工作。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,BENCHMARK 2021-B27 MORTGAGE TRUST数据集作为美国证券交易委员会(SEC)ABS-EE监管申报数据的结构化档案,为学者与从业者提供了抵押贷款支持证券(MBS)在2021年至2024年间详尽的底层资产层面信息。其经典使用场景聚焦于基于单笔贷款级别数据的现金流建模与信用风险剖析,通过解析Parquet文件中包含的贷款余额、利率、还款状态等变量,研究者能够构建精细化的提前偿付与违约预测模型,从而深入揭示证券化池的绩效波动规律。
解决学术问题
该数据集精准回应当前金融学术研究中对透明化、标准化底层数据渴求的痛点,尤其破解了以往因数据匮乏而难以开展的证券化资产异质性分析难题。通过提供连续38个申报周期的月度贷款层面快照,它使得追踪资产池的宏观与微观动态成为可能,助力学者剖析宏观经济周期、利率政策与借款人行为之间的复杂交互效应,进而在抵押贷款违约传染机制、分层债券信用增级效率及信息不对称成本等核心问题上取得突破性认知。
衍生相关工作
围绕该结构化数据已经或正在催化一系列衍生性工作,例如从这些标准化XML解析的资产级别指标出发,研究者开发了专门的ABS绩效仪表盘与可视化工具,实现实时生成资产池聚合统计量。此外,基于该数据集的机器学习模型也层出不穷,诸如利用时间序列学习提前偿付率从线性回归转向基于注意力机制的长短期记忆网络,以捕捉复杂时序依赖。这些创新性工作不仅深化了证券化分析的方法论边界,也为构建新一代智能风险预警系统铺设了数据基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作