DenyTranDFW/BBCMS_Mortgage_Trust_2022_C18_1950140
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BBCMS_Mortgage_Trust_2022_C18_1950140
下载链接
链接失效反馈官方服务:
资源简介:
BBCMS Mortgage Trust 2022-C18的SEC ABS-EE资产级别备案数据集,包含CIK 1950140的相关文件。数据集由19个备案文件组成,转换为38个Parquet格式文件,总大小25.7 MB,覆盖2022年12月12日至2024年6月11日的报告期。这些Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按照{accession_nodash}/{exhibit_name}.parquet格式组织。数据集还包括完整的备案索引,详细列出了每个备案的CIK、表单类型、访问号、报告日期和URL信息。
SEC ABS-EE asset-level filings for CIK 1950140 (BBCMS Mortgage Trust 2022-C18). The dataset contains 19 filings converted into 38 Parquet files totaling 25.7 MB, covering the reporting period from 2022-12-12 to 2024-06-11. Parquet files are loan-level/asset-level data extracted from XML exhibits, organized as {accession_nodash}/{exhibit_name}.parquet. The dataset also includes a complete filing index listing CIK, form type, accession number, report date, and URL for each filing.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化)监管申报体系,聚焦于CIK编号为1950140的BBCMS Mortgage Trust 2022-C18信托基金。数据集通过系统化抓取该实体在2022年12月12日至2024年6月11日期间提交的全部19份ABS-EE表格,并从中提取XML附件中的贷款级或资产级结构化数据,经解析后以Parquet格式文件形式存储。每份文件按“获取编号去横杠/附件名称.parquet”的规范路径组织,保证了数据溯源与文件管理的清晰性。数据集共包含38个Parquet文件,总容量达25.7 MB,涵盖了完整的报告期序列。
特点
本数据集最显著的特点在于其高度结构化与细粒度属性,提供了针对单一商业抵押贷款证券化信托的逐笔资产级信息。数据来源直接锚定SEC官方电子化申报通道,确保了信息的权威性与合规性。通过Parquet这一高效的列式存储格式,数据在压缩比、查询性能与跨平台兼容性上表现卓越,尤其适宜于大规模金融数据分析场景。此外,数据集的报告期跨度涵盖近一年半的月度披露,形成了连续的时间序列,便于研究者追踪底层资产池的表现演变与信用风险动态。
使用方法
使用者可通过加载Parquet文件直接开展金融分析,例如在Python环境中借助Pandas库的read_parquet函数或Spark框架进行数据读取。每个Parquet文件对应特定申报期内的特定附件,文件名命名规则(如“{accession_nodash}/{exhibit_name}.parquet”)提供了清晰的索引路径,方便按时间或申报编号筛选。数据集搭配的申报索引表格(cik、form、accessionNumber、reportDate、url)可作为元数据目录,辅助用户定位到具体的SEC原始申报页面进行交叉验证。推荐用于资产证券化研究、贷款池表现评估以及监管合规性检查等场景。
背景与挑战
背景概述
在资产支持证券(ABS)领域,透明且标准化的资产层面数据对于市场参与者评估风险、进行定价和监管合规至关重要。美国证券交易委员会(SEC)通过ABS-EE(Asset-Backed Securities - Exhibit E)规则,要求发行人定期提交包含逐笔贷款细节的XML格式资产级数据。BBCMS Mortgage Trust 2022-C18数据集正是基于这一背景而构建,它收录了自2022年12月至2024年6月期间,由SEC CIK编号1950140所对应的商业抵押贷款支持证券(CMBS)信托的19份ABS-EE申报文件。该数据集由第三方机构整理自SEC EDGAR系统,共生成38个Parquet格式文件,总容量约25.7 MB,旨在为机器学习、金融风险建模和监管科技研究提供可机读的标准化结构化数据资源。其发布显著提升了CMBS次级贷款数据的可获取性与分析效率,为资产证券化市场的实证研究奠定了数据基础。
当前挑战
该数据集所解决的领域核心挑战在于:资产支持证券市场长期面临信息不对称与数据非结构化问题。传统上,CMBS的资产级细节散布于冗长的PDF或非规范XML中,导致投资者和监管机构难以系统提取用于违约预测、现金流建模及压力测试的关键要素,如贷款绩效指标、抵押品估值及地域集中度。构建过程中同样遭遇严峻考验:一是如何从SEC EDGAR中高达数十万份的申报文件中精准识别并抓取特定CIK(1950140)的ABS-EE附件,需设计高效爬虫与校验机制;二是XML字段命名与数据结构随申报时间变化而存在不一致性,需通过大量手工清洗与映射工作建立统一的Parquet schema;三是时间跨度内部分申报文件的缺失或格式错误,迫使数据集构建者采用多源交叉验证策略补全记录,确保时序完整性。
常用场景
经典使用场景
在资产证券化(ABS)领域,BBCMS Mortgage Trust 2022-C18 数据集作为美国证券交易委员会(SEC)ABS-EE监管申报的资产级数据集合,为金融风险建模与结构化产品分析提供了精细到每笔贷款的微观数据基础。该数据集涵盖从2022年12月至2024年6月的19份申报文件,提取自XML展品中的贷款层面信息,并以Parquet格式高效存储,便于研究者量化分析商业抵押贷款支持证券(CMBS)的现金流结构、违约概率及提前偿付行为。经典使用场景包括利用贷款级数据构建信用风险评估模型、模拟资产池的损失分布,以及验证资产证券化产品的定价合理性,从而深刻揭示CMBS市场的内在风险传导机制。
实际应用
在实际应用中,BBCMS Mortgage Trust 2022-C18 数据集是金融机构、评级机构和监管科技公司的核心数据资产。投资机构利用其贷款级信息优化CMBS投资组合的构建与压力测试,量化市场波动下的资产价值变化;信用评级机构则基于该数据校准违约损失率及评级迁移矩阵,提升结构化产品评级的准确性与透明度。此外,金融科技企业将其应用于自动化证券化分析平台的开发,通过大数据技术实时追踪抵押贷款表现,为二级市场交易提供定价基准,同时助力监管机构高效核查ABS-EE申报合规性,降低系统性金融风险。
衍生相关工作
围绕该数据集,衍生了一系列具有影响力的经典工作。数据工程师开发了将XML展品转换为Parquet格式的批量解析工具,极大提升了大规模资产级数据的处理效率;机器学习领域的研究者则利用该数据构建了基于梯度提升树的CMBS违约预测模型,并与传统逻辑回归模型对比,验证了集成学习方法在信用风险建模中的优越性。此外,计量经济学家基于此数据集进行了贷款特征与提前偿付行为的面板数据分析,提出了考虑借款人异质性的动态风险模型,这些工作共同推动了资产证券化数据分析方法论从静态统计向动态智能的范式转变。
以上内容由遇见数据集搜集并总结生成



