DenyTranDFW/Volkswagen_Auto_Loan_Enhanced_Trust_2021_1_1878944
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Volkswagen_Auto_Loan_Enhanced_Trust_2021_1_1878944
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别文件,涉及CIK 1878944(大众汽车贷款增强信托2021-1)。数据集包括37份文件,62个Parquet文件,总大小为206.2 MB。报告期从2021年9月30日至2025年6月30日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate。
SEC ABS-EE asset-level filings for CIK 1878944 (Volkswagen Auto Loan Enhanced Trust 2021-1). The dataset includes 37 filings, 62 parquet files, with a total size of 206.2 MB. The reporting period spans from 2021-09-30 to 2025-06-30. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
本数据集基于美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化提交)体系构建,聚焦于Volkswagen Auto Loan Enhanced Trust 2021-1(CIK代码1878944)的资产层面披露文件。数据源自SEC EDGAR系统中XML格式的附件,经过解析与转换,生成62个Parquet文件,总计206.2 MB。每个文件以{accession_nodash}/{exhibit_name}.parquet的层级结构组织,确保数据可追溯性。报告期覆盖2021年9月30日至2025年6月30日,共包含37份申报文件,其报告日期直接从底层XML的reportingPeriodEndingDate字段提取,保证了时间信息的精确性。
特点
该数据集的核心特色在于其细粒度的贷款层面数据,完整记录了大众汽车贷款增强信托2021-1在约四年报告期内的资产表现。数据结构严谨,每个Parquet文件代表特定申报中的单一附件,便于按需加载与查询。数据来源为SEC官方披露,具有高度权威性与标准化格式,适用于资产证券化领域的深度分析。36份申报文件提供了连续的月度或季度时间序列,覆盖了从起始日至2025年的完整周期,为研究汽车贷款证券化产品的违约率、提前还款等关键指标提供了珍贵素材。
使用方法
研究者可通过Python等支持Parquet格式的工具直接加载数据集,例如使用pandas库的read_parquet函数,以{accession_nodash}/{exhibit_name}.parquet路径访问具体文件。建议根据申报编号(accessionNumber)或报告日期筛选所需时间窗口,结合SEC官网提供的原始XML进行交叉验证。典型应用包括构建贷款绩效统计模型、分析资产池的信用风险演变,或作为ABS-EE标准化数据的基准测试集。数据集遵循GPL许可证,允许学术与商业用途的二次分发,但需注意引用原始SEC提交信息。
背景与挑战
背景概述
在资产证券化(ABS)领域,贷款级数据的标准化与可获取性对于风险定价、监管合规及市场透明度至关重要。Volkswagen Auto Loan Enhanced Trust 2021-1数据集由美国证券交易委员会(SEC)依据ABS-EE(Asset-Backed Securities Exchange of Electronic)规则披露,涵盖大众汽车2021年首期汽车贷款支持证券的完整资产层级信息。该数据集创建于2021年,由SEC Edgar系统托管,包含37份申报文件及62个Parquet格式文件,总计206.2 MB,时间跨度从2021年9月至2025年6月。核心研究问题聚焦于如何通过结构化XML展品解析贷款级明细数据,以支持对汽车ABS信用表现、现金流分布及违约风险的精细化建模。作为SEC强制性披露框架下的典型范例,该数据集为金融监管机构、资产定价学者及量化分析师提供了高频率、细粒度的实证基础,推动了ABS市场信息对称性的提升与模型验证的标准化进程。
当前挑战
该数据集所解决的领域问题在于汽车ABS二级市场中普遍存在的信息不对称与数据碎片化挑战。传统ABS分析依赖宽泛的资产池汇总指标,难以捕捉单笔贷款的异质性风险,而该数据集的贷款级粒度直接支持对借款人信用评分、贷款期限、车辆折旧率等因子对违约影响的归因分析。构建过程中面临的技术挑战包括:从非结构化SEC XML展品中自动化提取62个Parquet文件时,需处理日期格式不一致(如reportingPeriodEndingDate的解析)、缺失值填充策略以及跨申报文件的数据一致性校验。此外,37份文件的序列化时间跨度长达4年,需维护时间戳对齐逻辑以生成面板数据,应对监管报告周期变更(如从按月到按季的披露频率调整)带来的窗口期错配问题。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,Volkswagen_Auto_Loan_Enhanced_Trust_2021_1_1878944数据集以其详尽的贷款层面数据,成为剖析汽车贷款支持证券内在结构与动态表现的核心资源。该数据集包含自2021年9月至2025年6月期间37份SEC ABS-EE备案文件,覆盖了逐笔贷款的还款、违约、提前偿付等关键指标,为学者提供了从微观视角审视资产池信用质量演变的独特窗口。经典使用场景包括构建贷款生命周期模型、评估不同宏观经济情景下资产池的损失分布,以及验证结构性增信措施的实际效力。通过分析这些高频率、精细化的资产级数据,研究者能够洞察贷款特征与证券表现之间的因果关系,为优化ABS定价模型和风险管理框架奠定坚实基础。
实际应用
在实际金融实务中,该数据集为投资机构、评级机构和监管主体提供了不可替代的决策支持工具。投资经理可利用贷款级信息构建压力测试模型,识别资产池中潜在的高风险集中度(如特定地理区域或到期期限的贷款集群),进而优化投资组合配置。评级机构可基于实际违约历史校准评级模型参数,提升对同类ABS产品的信用评估精度。对于监管层面,该数据集揭示了资产池内部异质性对系统稳定性的影响,有助于制定更细化的资产级披露规则,防范因信息鸿沟引发的市场失灵。同时,金融机构可借鉴其数据架构,构建内部风险监控系统,实现从静态评级到动态资产评管的范式转变。
衍生相关工作
围绕Volkswagen_Auto_Loan_Enhanced_Trust_2021_1_1878944数据集,学术界与业界已衍生出一系列经典工作。在机器学习领域,研究者利用其序列化时序数据训练LSTM或Transformer模型,预测贷款违约概率与提前还款时机,开创了ABS风险建模的新范式。在计量经济学方向,一些工作提出了多因子动态模型,将数据集中的个体贷款表现与宏观变量(如利率、失业率)耦合,解析系统性风险传导路径。此外,该数据集催生了针对ABS数据标准化与互操作性的方法论研究,例如设计统一的资产级数据Schema以兼容不同发行方的披露格式。这些衍生工作不仅拓展了数据集的应用边界,也促进了金融、计算机科学及数据治理学科的交叉融合。
以上内容由遇见数据集搜集并总结生成



