DenyTranDFW/Capital_One_Prime_Auto_Receivables_Trust_2024_1_2039534
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Capital_One_Prime_Auto_Receivables_Trust_2024_1_2039534
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)关于Capital One Prime Auto Receivables Trust 2024-1的ABS-EE资产级别文件。数据集提供了19个Parquet格式的文件,总大小为60.3 MB,涵盖了从2024年9月30日至2026年3月31日的报告期。这些文件是从XML展品中提取的贷款级别/资产级别数据,并按{accession_nodash}/{exhibit_name}.parquet的方式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate字段。
SEC ABS-EE asset-level filings for CIK **2039534** (Capital One Prime Auto Receivables Trust 2024-1). The dataset includes 19 Parquet files with a total size of 60.3 MB, covering the reporting period from 2024-09-30 to 2026-03-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as `{accession_nodash}/{exhibit_name}.parquet`. Reporting-period dates are derived from the asset-level XML (`reportingPeriodEndingDate`).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化填报)系统,聚焦于Capital One Prime Auto Receivables Trust 2024-1(CIK编号2039534)的资产层面披露信息。数据构建方式为从XML展品中提取贷款级或资产级数据,并转化为Parquet文件格式进行存储。每个Parquet文件以`{accession_nodash}/{exhibit_name}.parquet`的命名规则组织,共收录了19份SEC申报文件。报告期起始于2024年9月30日,结束于2026年3月31日,具体日期源自资产级XML中的`reportingPeriodEndingDate`字段。整个数据集总大小约为60.3 MB,确保了数据的结构化与可访问性。
特点
该数据集的核心特点在于其精细的资产级粒度与结构化组织形式。数据覆盖了19个连续的月度报告周期,时间跨度长达18个月,提供了从交易初始到后期表现的完整时间序列信息。每个Parquet文件均保留了原始XML展品中的详细贷款属性,且通过标准化的命名体系便于按报告期和展品名称进行索引。此外,数据集附带了完整的申报索引表,包含CIK编号、表单类型、接入号、报告日期及SEC官网链接,为研究人员提供了便捷的溯源与交叉验证途径。这种设计使得数据既适合进行深度的资产池分析,也便于与SEC官方源数据保持一致性与可审计性。
使用方法
用户可通过Python的数据处理库(如Pandas或Dask)直接读取Parquet文件,利用其高效的列式存储特性进行大规模数据分析。每个Parquet文件对应特定报告期的资产级数据,用户可按需加载单个文件或批量处理所有文件进行时序比较。数据集中已包含报告期结束日期字段,便于进行时间序列建模或违约率预测。此外,通过索引表中的SEC官网链接,用户可以追溯到原始XML申报材料,进行深层次的数据验证或补充信息获取。对于金融科技或资产证券化领域的研究者而言,该数据集为开发基于历史表现的风险评估模型提供了坚实的基础数据支持。
背景与挑战
背景概述
资产支持证券(ABS)作为结构化金融产品的核心组成部分,其信息透明度和数据完整性对市场运行与风险评估至关重要。Capital One Prime Auto Receivables Trust 2024-1数据集由美国证券交易委员会(SEC)依据ABS-EE监管要求创建,聚焦于Capital One于2024年发起的优质汽车贷款证券化交易,其数据时间跨度自2024年9月30日至2026年3月31日。该数据集通过提取19份自XML附件的贷款层级的精细信息,并以Parquet格式组织,旨在为研究者与市场参与者提供标准化、可机读的资产表现档案。作为针对特定交易结构的高频数据集,它为理解汽车ABS池的偿付特性、信用风险演变及监管合规实践提供了实证基础,对结构化金融数据分析领域具有重要价值。
当前挑战
该数据集所应对的核心领域挑战在于汽车贷款ABS的透明度不足与异质性风险——传统披露格式难以为机器学习或统计模型提供结构化、可比较的数据源,导致违约预测与现金流建模的精度受限。构建过程中,挑战集中于从SEC EDGAR系统海量XML解析中稳定提取复杂嵌套字段(如贷款条款、还款历史),需解决标识符一致性、时间序列对齐及缺失值处理等问题,同时确保19份文件的时间跨度统一且符合监管报告周期,这些技术细节影响到数据集的质量与可用性。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,Capital One Prime Auto Receivables Trust 2024-1 数据集以其详尽的贷款级资产层面数据脱颖而出。该数据集收录了自2024年9月至2026年3月间19份SEC ABS-EE监管申报文件,每份文件均以Parquet格式存储,揭示了逐笔汽车贷款的动态表现。经典使用场景聚焦于构建基于机器学习的违约与提前偿付预测模型,研究人员可利用报告中连续的贷款状态字段,精准捕捉借款人的还款行为变化,从而评估资产池的信用风险波动。
衍生相关工作
围绕该数据集衍生了一系列标志性工作,包括基于时间序列的贷款级还款模式聚类研究,以及引入宏观经济变量预测资产池损失分布的开源模型。部分学者将其与ICE Data Services、S&P Capital IQ等商业数据库进行交叉验证,揭示ABS-EE申报标准下的默认定价误差。此外,以该数据集为基准的Kaggle竞赛和GitHub项目催生了多种端到端ABS估值流水线,促进了金融自然语言处理技术在XML结构化数据解析中的创新应用。
数据集最近研究
最新研究方向
在资产证券化领域,以Capital One Prime Auto Receivables Trust 2024-1为代表的数据集,依托SEC ABS-EE强制披露框架,汇聚了自2024年9月至2026年3月间19份逐笔贷款层面的资产级明细数据,总容量达60.3 MB。这一前沿资源的涌现,正推动学界与业界聚焦于汽车贷款ABS的微观信用风险评估、现金流可预测性建模以及监管合规的算法化验证。尤其在后疫情时代消费信贷波动加剧的背景下,研究者可借助该数据集探索借款人偿付行为与宏观经济指标的耦合关系,并为结构化产品的定价及风险分层提供精细化的实证依据,其透明化披露与标准化格式亦为提升市场效率与监管透明度树立了新的标杆。
以上内容由遇见数据集搜集并总结生成



