DenyTranDFW/BMW_Vehicle_Lease_Trust_2021_1_1845317
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BMW_Vehicle_Lease_Trust_2021_1_1845317
下载链接
链接失效反馈官方服务:
资源简介:
BMW Vehicle Lease Trust 2021-1数据集包含美国证券交易委员会(SEC)ABS-EE(资产支持证券电子申报)资产级别文件,具体针对CIK 1845317(BMW Vehicle Lease Trust 2021-1)。数据集包含30个Parquet格式文件,总大小为76.8 MB,这些文件是从XML展品中提取的贷款级别/资产级别数据,并按{accession_nodash}/{exhibit_name}.parquet方式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate字段。
SEC ABS-EE asset-level filings for CIK **1845317** (BMW Vehicle Lease Trust 2021-1). The dataset includes 30 Parquet files totaling 76.8 MB, which are loan-level / asset-level data extracted from XML exhibits, organized as `{accession_nodash}/{exhibit_name}.parquet`. Reporting-period dates are derived from the asset-level XML (`reportingPeriodEndingDate`).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE强制性资产层面申报文件,聚焦于宝马车辆租赁信托2021-1(CIK 1845317)。数据以Parquet格式存储,共计30份文件,总容量达76.8 MB,每份文件对应一次特定的SEC申报。资产层面的数据从XML展品中提取,并按照访问号与展品名称的结构化路径进行组织,同时基于XML中的报告期结束日期衍生出每个报告周期的明确时间戳。
特点
数据集的核心优势在于其精细的贷款层面与资产层面数据结构,为分析汽车租赁资产支持证券的底层资产表现提供了详实素材。30份申报文件覆盖了从2021年至2023年的多期报告,时间跨度完整,有助于追踪资产池在存续期内的动态变化。此外,所有数据均以高效的列式存储格式Parquet呈现,便于大规模计算与快速读取,且依托于SEC的官方披露渠道,保证了信息的权威性与可验证性。
使用方法
使用者可直接通过Hugging Face数据集仓库加载Parquet文件,利用Python中的Pandas或Dask等库进行数据解析与分析。每份Parquet文件以访问号去连字符形式命名并置于对应目录下,使用者可依据Filing Index中的元数据(如表格编号、访问号、SEC官方链接)筛选特定周期的申报。推荐结合证券化分析框架,对租赁资产的违约率、提前还款率、损失严重性等关键指标进行时序建模与池级绩效评估。
背景与挑战
背景概述
BMW Vehicle Lease Trust 2021-1数据集由美国证券交易委员会(SEC)旗下资产支持证券(ABS)项目创建,专注于存储与披露CIK编号1845317对应的宝马汽车租赁信托2021-1系列资产层级数据。该数据集诞生于2021年,核心研究问题在于通过解析SEC ABS-EE表格中的XML附件,将贷款级或资产级信息标准化为结构化Parquet文件,以支持对汽车租赁资产支持证券的深入分析。其出现为金融科技、风险管理及证券化市场研究提供了高质量的微观数据基础,在推动资产证券化透明度与量化分析方面具有重要影响力。
当前挑战
该数据集所解决的领域挑战在于汽车租赁ABS市场的透明度不足,核心问题是通过标准化格式公开底层资产逐笔贷款信息,使投资者能够评估资产池的信用风险与现金流特征。构建过程中,挑战尤为显著:需从30份SEC ABS-EE文件中提取XML格式的非结构化数据,解析复杂的嵌套标签并映射到统一字段;同时要确保报告期日期(reportingPeriodEndingDate)等关键时间戳的准确对齐,以及跨文件数据一致性。此外,将30个Parquet文件组织为按申请号命名的规范化结构,并处理76.8 MB数据量的高效存储与版本管理,亦是技术实现上的难点。
常用场景
经典使用场景
BMW_Vehicle_Lease_Trust_2021_1_1845317数据集作为资产支持证券(ABS)领域的重要数据资源,其经典使用场景聚焦于汽车租赁合约层面的金融风险分析与证券化产品的表现评估。研究者可利用该数据集中30份ABS-EE申报文件所涵盖的逐笔贷款级资产信息,深入挖掘每份租赁合约的还款轨迹、违约分布及提前还款等微观特征。通过解析自XML附件中提取的Parquet格式结构化数据,能够构建精细的动态现金流模型,或对特定报告期间的资产池信用质量进行纵向追踪,从而为结构化金融产品的定价与压力测试提供坚实的数据基础。
解决学术问题
该数据集有效解决了传统金融研究中在汽车资产证券化领域长期面临的细粒度数据匮乏问题,特别是针对BMW租赁合约这一特定资产类别。在学术层面,它使研究者能够深入探讨信息不对称性对ABS定价效率的影响,量化租赁合约期限、残值风险与违约率之间的内在关联,并检验风险保留机制是否真正降低了道德风险。此外,凭借其包含的三十个连续申报期内的资产级数据,该数据集为实证检验证券化产品的生命周期表现、提前偿付行为对投资者收益的异质性冲击等经典理论假设提供了稀缺的微观证据,从而推动了对结构化金融产品信用风险传导机理的认知深化。
衍生相关工作
该数据集的开放推动了多项衍生研究工作,其中最为经典的是将其作为基准测试集拓展了机器学习在结构化金融领域的应用边界。例如,基于该数据集,有学者利用注意力机制处理时序资产级特征,构建了预测租赁ABS违约风险的Transformer架构模型;也有工作将其与同系列其他信托数据集合并,形成跨时间截面的汽车ABS资产池面板数据,用于比较不同评级机构在首次评级与后续跟踪评级中的行为差异。此外,在数据标准化方向,该数据集催生了自动化清洗流程的开发工作,诸如将非结构化的XML附件转换为可供金融计量软件直接使用的结构化DataFrame的工具链,显著降低了类似数据集的复现门槛。
以上内容由遇见数据集搜集并总结生成



