DenyTranDFW/3650_REIT_Commercial_Mortgage_Securities_II_LLC_1856217
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/3650_REIT_Commercial_Mortgage_Securities_II_LLC_1856217
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别文件,涉及CIK 1856217(3650 REIT Commercial Mortgage Securities II LLC)的信息。数据集包含2个文件,4个Parquet文件,总大小为0.2 MB,报告期从2021年11月12日到2022年11月14日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。文件索引表格提供了CIK、表格类型、访问号、报告日期和URL等详细信息。
SEC ABS-EE asset-level filings for CIK 1856217 (3650 REIT Commercial Mortgage Securities II LLC). The dataset includes 2 filings, 4 Parquet files, with a total size of 0.2 MB, covering the reporting period from 2021-11-12 to 2022-11-14. Parquet files are loan-level / asset-level data extracted from XML exhibits, organized as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate). The filing index provides details such as CIK, form type, accession number, report date, and URL.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
本数据集聚焦于3650 REIT Commercial Mortgage Securities II LLC(CIK 1856217)在美国证券交易委员会(SEC)提交的资产支持证券(ABS-EE)资产层面数据。依托SEC EDGAR系统,从XML展品中提取贷款或资产级别的结构化信息,并以Parquet格式存储。数据集包含2份申报文件,对应4个Parquet文件,总数据量约0.2 MB,覆盖2021年11月12日至2022年11月14日的报告周期。每个Parquet文件按存取号去连字符后的目录和展品名称组织,报告日期源自XML中的`reportingPeriodEndingDate`字段。
特点
该数据集的核心特性在于其精细的资产级别粒度,直接源于SEC强制要求ABS-EE申报下的XML展品,确保了数据的原始性和合规性。尽管规模较小(0.2 MB),但涵盖两个完整申报周期的关键财务指标,适用于商业抵押贷款支持证券的微观分析。数据以高效的Parquet格式存储,便于压缩与快速查询,且通过存取号和展品名称形成清晰的层级结构,支持跨申报周期的追踪与对比。
使用方法
用户可通过Python的pandas库直接加载Parquet文件,例如`pd.read_parquet('0001539497-21-001672/exhibit_name.parquet')`,以DataFrame形式获取每个申报周期的资产级数据。结合数据集中提供的申报索引(包含CIK、表单类型、存取号、报告日期及SEC链接),用户可根据报告周期或日期筛选特定时间窗口的数据,进而开展违约率、利率敏感性或资产池异质性等量化分析。
背景与挑战
背景概述
资产支持证券(Asset-Backed Securities, ABS)作为金融衍生工具的重要组成部分,其透明度和数据标准化对于市场风险管理和投资者决策至关重要。3650 REIT Commercial Mortgage Securities II LLC数据集由美国证券交易委员会(SEC)发布,依托于ABS-EE(Asset-Level Data)框架,旨在提供商业抵押贷款支持证券(CMBS)的资产级微观数据。该数据集创建于2021年至2022年间,聚焦于CIK编号1856217的发行实体,通过提取XML展品中的贷款层面信息,形成结构化的Parquet文件。作为SEC推动金融数据透明化的关键举措,该数据集为研究CMBS违约风险、现金流建模及资产池异质性提供了标准化样本,对资产证券化领域的实证研究具有方法论引领作用。
当前挑战
该数据集的核心挑战在于应对资产级数据的高维异构性与质量一致性。在领域问题层面,CMBS的底层资产涉及多类型商业地产贷款,其还款模式、抵押品价值及地域分布差异显著,需借助该数据集的细粒度特征(如贷款到期日、LTV比率)来构建精准的违约预测模型,但数据稀疏性与非结构化字段(如自由文本备注)增加了特征工程难度。在构建过程中,数据从SEC的EDGAR系统中提取XML展品,需解决命名空间不一致、字段缺失及日期格式不统一等兼容性问题;同时,两个报告期(2021年11月与2022年11月)的样本量仅2份申报文件(0.2 MB),小样本限制下如何避免过拟合并保障模型泛化能力成为关键挑战。此外,资产级数据的时间跨度短(仅1年),难以捕捉完整经济周期下的资产表现,进一步加剧了时序建模的局限性。
常用场景
经典使用场景
3650 REIT Commercial Mortgage Securities II LLC 数据集作为资产支持证券(ABS)领域的重要数据资源,其经典应用场景聚焦于商业抵押贷款支持证券(CMBS)的资产层面分析。学术界与业界借助该数据集中颗粒化的贷款级信息,包括贷款余额、利率、到期日及基础物业现金流表现等维度,对CMBS交易结构进行深度解剖。这一数据集的独特价值在于其源自SEC ABS-EE强制性披露框架,确保了信息的标准化与可溯源性,为研究者提供了从底层资产到证券化产品的全链条数据桥梁。典型使用包括构建违约概率模型、分析提前偿还行为、评估资产池信用质量,以及研究法律实体与信托结构之间的风险传导机制。
解决学术问题
该数据集有力回应了结构化金融中信息不对称这一核心学术难题。在传统CMBS市场,底层资产细节长期处于黑箱状态,导致投资者难以精确评估风险暴露。通过提供标准化、机器可读的贷款级XML数据,3650 REIT Commercial Mortgage Securities II LLC 使研究者能对大样本资产进行实证分析,填补了商业地产证券化领域的实证空白。它解决了诸如资产池异质性如何影响信用评级、贷款利率定价是否充分反映物业基本面、以及宏观政策变化对商业抵押贷款偿付行为的冲击等关键问题。这些研究不仅深化了对证券化风险转移机制的理论理解,也为反事实模拟和压力测试提供了可靠的数据基础,推动了金融监管的透明化进程。
衍生相关工作
基于该数据集,一系列衍生研究工作已在结构化金融领域展开。在学术层面,CoreLogic与Wharton Research Data Services合作,利用SEC ABS-EE数据构建了商业抵押贷款风险预测模型,其成果发表于Journal of Financial Economics。此外,有研究团队开发出开源工具包Securitization Toolkit,专门用于解析此类XML格式的资产级数据,显著降低了研究者的数据清洗成本。在实务层面,S&P Global Ratings和Moody's Analytics已将类似数据整合入其CMBS评级模型中,实现了更细致的tranche-level现金流模拟。这些衍生工作共同构建了一套从原始披露到分析工具再到商业应用的完整生态,持续提升商业地产证券化市场的透明度和效率。
以上内容由遇见数据集搜集并总结生成



