five

DenyTranDFW/CarMax_Auto_Owner_Trust_2025_1_2049715

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/CarMax_Auto_Owner_Trust_2025_1_2049715
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含SEC ABS-EE资产级别文件,涉及CIK 2049715(CarMax Auto Owner Trust 2025-1)。数据集包含17个文件,总大小为94.0 MB,报告期为2024年12月31日至2026年3月31日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 2049715 (CarMax Auto Owner Trust 2025-1). The dataset includes 17 filings, totaling 94.0 MB, with a reporting period from 2024-12-31 to 2026-03-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源于美国证券交易委员会(SEC)强制要求资产支持证券(ABS)发行人提交的ABS-EE表格,聚焦于CarMax Auto Owner Trust 2025-1(CIK编号2049715)的资产层面数据。通过系统抓取17份ABS-EE申报文件中的XML附件,提取出逐笔贷款级别的详细信息,并转换为Parquet格式存储。每份文件以唯一的接入号(accession number)区分,内部按展品名称(exhibit name)组织为独立的Parquet文件,共生成17份高质量的结构化数据,总体积约94.0 MB,覆盖从2024年12月31日至2026年3月31日的报告期。
特点
该数据集具有鲜明的时序性与完整性特征,时间跨度涵盖15个连续的报告月份,能够清晰呈现资产池在存续期内逐月的表现变化。每份Parquet文件均严格对应原始申报中的XML展品,确保了数据来源的权威性和可追溯性。在金融分析领域,这种逐笔贷款级别的微观数据尤为珍贵,可支持对CarMax车贷资产池的信用风险、提前偿付率、逾期分布等关键指标进行精细化的动态评估,为资产支持证券的定价、评级及投资决策提供坚实的数据基础。
使用方法
数据集可直接通过Python的pandas库加载Parquet文件进行读取与分析,用户可根据接入号与展品名称的路径结构快速筛选特定时间点或特定类型的数据。得益于格式的统一性与元数据的完整性,研究者能够便捷地将资产层面的原始数据与SEC EDGAR数据库中的申报文本进行关联与验证。建议使用者在分析前整合全部文件,构建时间序列面板数据,以充分发挥其纵向比较的优势。数据集已在Hugging Face平台开源,采用GPL许可证,支持直接下载或通过datasets库加载使用。
背景与挑战
背景概述
在资产证券化(ABS)领域,信息披露的透明度与标准化对于市场稳定与风险定价至关重要。CarMax Auto Owner Trust 2025-1 数据集由美国证券交易委员会(SEC)ABS-EE系统归档,自2024年12月起,CarMax公司通过该信托发行了17份资产层级申报文件,覆盖至2026年3月的报告期。该数据集以Parquet格式存储了约94 MB的逐笔贷款数据,旨在为研究者提供标准化的ABS底层资产结构性信息,推动信用风险评估与监管合规分析。作为汽车贷款证券化市场的重要范例,该数据集弥合了公开数据与细节金融建模之间的鸿沟,对深化资产支持证券的微观结构理解具有显著学术与实践价值。
当前挑战
该数据集的核心挑战在于解决资产支持证券(ABS)领域长期存在的底层资产信息碎片化问题。具体而言,1)领域内面临的风险评估困境源于贷款池异质性,如不同信用评分、还款期限与地域分布的贷款组合,需从分散的XML申报中提取结构化特征以建模违约概率;2)构建过程中,将SEC EDGAR系统内非标准化的ABS-EE XML文件转换为统一的Parquet格式,需处理17个跨报告期文件的数据一致性,包括确保时间戳字段(如reportingPeriodEndingDate)的精确对齐,以及解决因法规变更导致的元数据差异。这些挑战要求数据集具备鲁棒的解析逻辑与低容错率,方能支撑高置信度的量化分析。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,CarMax Auto Owner Trust 2025-1 数据集以其精细的贷款层面资产级数据,成为剖析汽车贷款支持证券违约风险与提前偿付行为的经典样本。该数据集涵盖了从2024年底至2026年初的多期报告,每期均以Parquet格式存储自SEC ABS-EE XML展品中提取的结构化信息,为研究者提供了审视底层贷款池逐笔表现的高保真窗口。常用的场景包括构建动态违约概率模型、评估贷款特征(如信用评分、贷款价值比、剩余期限)对资产池信用质量的影响,以及模拟不同经济情境下的现金流结构变化,从而验证信用评级机构所采用的假设。
解决学术问题
此数据集有效回应了金融领域关于信息不对称与资产定价效率的核心学术命题。在传统的ABS市场中,投资者往往难以获取标准化的底层资产表现数据,而CarMax Auto Owner Trust 2025-1 通过SEC强制披露的ABS-EE规则,将逐笔贷款的还款状态、逾期天数与损失情况透明化,使得学术界可以深入检验贷款池的异质性如何传导至证券化产品的分层风险溢价。它解决了诸如道德风险下发起人是否保留高风险贷款、以及资产池分散化程度对信用增级设计的实证验证等关键问题,为理解结构化金融产品的内在脆弱性提供了宝贵的微观证据。
衍生相关工作
围绕CarMax Auto Owner Trust 2025-1 数据集,学术界与业界已衍生出多项前沿工作。其中,有研究将该数据集与公用事业、信用卡等其他ABS-EE资产级数据集联合,训练跨资产类别的迁移学习模型,旨在统一不同领域下的违约概率估计框架。另一方向的工作聚焦于序列借贷行为建模,利用多期报告中的时间戳信息,结合循环神经网络预测贷款池的逐月现金流衰减曲线。此外,部分学者尝试将数据转化为图结构,通过图神经网络揭示贷款池内借款人与车商网络的隐含关联,从而改进风险传染路径的模拟精度。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作