DenyTranDFW/CarMax_Auto_Owner_Trust_2025_3_2074530
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/CarMax_Auto_Owner_Trust_2025_3_2074530
下载链接
链接失效反馈官方服务:
资源简介:
SEC ABS-EE资产级别文件,涉及CIK 2074530(CarMax Auto Owner Trust 2025-3)。包括11个文件,总大小为64.1 MB,报告期从2025-06-30至2026-03-31。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。
SEC ABS-EE asset-level filings for CIK 2074530 (CarMax Auto Owner Trust 2025-3). Includes 11 filings, total size 64.1 MB, reporting period from 2025-06-30 to 2026-03-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
在资产支持证券(ABS)领域,标的资产层面的数据对于评估证券化产品的信用风险与现金流表现至关重要。CarMax Auto Owner Trust 2025-3 数据集正是基于美国证券交易委员会(SEC)ABS-EE申报规则而构建的,专注于CIK编号为2074530的特定信托产品。该数据集由11份XML展品中的贷款级/资产级数据提取而成,经过系统性解析与转换,最终形成11个Parquet文件,总容量达64.1 MB。这些文件按照“{accession_nodash}/{exhibit_name}.parquet”的格式组织,其中报告期日期严格源自XML中标记的“reportingPeriodEndingDate”字段,覆盖从2025年6月30日至2026年3月31日的时间跨度,从而确保了资产层面信息的时序完整性与来源的权威性。
特点
该数据集的核心特点在于其精细化的资产级粒度与结构化的数据存储形式。不同于传统的汇总型ABS数据,本数据集提供了每笔贷款的详细信息,为深度定量分析提供了坚实基础。其以Parquet格式存储,不仅大幅提升了数据的压缩效率与查询性能,还兼容主流大数据分析工具。此外,数据集附带了完整的备案索引,清晰列出了每份申报的CIK、表格类型(均为ABS-EE)、访问编号、报告日期及对应的SEC官方存档链接,使用户能够便捷地追溯到原始申报文件。这一设计既保障了数据的可验证性,也极大简化了跨文件、跨时间周期的关联分析流程。
使用方法
使用此数据集时,研究者可直接通过Python中的Pandas等库加载Parquet文件,快速获取贷款级别的结构化信息。建议首先利用附带的备案索引表格筛选感兴趣的报告期或特定申报条目,随后根据对应的accession号与展品名称定位到具体的Parquet文件。由于数据集中包含多个月度报告期(如2025年6月至2026年3月的各月底数据),用户可通过日期字段进行时间序列分析,追踪信托池中每笔资产的动态变化。对于需要大规模数据分析的场景,推荐将全部Parquet文件并行读取后,基于贷款标识符进行跨期匹配,从而构建完整的贷款生命周期面板数据,以支持违约率预测、提前还款建模或信用评级校准等研究任务。
背景与挑战
背景概述
在资产支持证券(ABS)领域,美国证券交易委员会(SEC)要求发行人定期提交资产级数据,以提升市场透明度和风险定价能力。CarMax Auto Owner Trust 2025-3数据集由SEC的EDGAR系统于2025年至2026年间收集,围绕CarMax汽车贷款ABS的资产级信息构建。该数据集的核心研究问题聚焦于通过标准化XML披露贷款层面的绩效指标,如还款状态、利率和风险特征,从而支持投资者对汽车ABS组合的精细化分析。作为公开可用的结构化金融数据集,它填补了ABS市场中贷款级数据难以获取的空白,推动了信用风险建模、证券化市场监管和金融科技研究的发展,对政策制定者与学术界理解次贷汽车贷款的违约动态具有重要价值。
当前挑战
该数据集所解决的领域挑战在于汽车ABS市场长期存在的透明度不足,传统汇总报告掩盖了抵押贷款池的异质性,导致投资者难以准确评估早偿风险与违约相关性。具体挑战包括:1) 从非结构化的SEC XML文件中提取准确、完整的贷款字段,处理格式不一致与数据缺失问题;2) 将不同报告期的离散截面数据整合为连续的时序面板,以构建动态信用风险模型;3) 在学术与监管应用中平衡数据粒度与隐私约束,避免通过唯一标识符逆向识别借款人。构建过程中,还需应对不同期限报告中贷款状态变更的逻辑校验与跨文件链接关联,这增加了数据清洗与标准化的复杂性。
常用场景
经典使用场景
CarMax Auto Owner Trust 2025-3 数据集收录了由美国证券交易委员会(SEC)披露的资产支持证券(ABS)中资产层面的结构化数据,涵盖2025年6月至2026年3月期间共11份申报文件。该数据集的核心价值在于为金融科技与实证资产定价研究者提供了标准化的、细粒度至每笔汽车贷款的收益与风险特征信息。研究者可借助这些Parquet格式的贷款级数据,剖析汽车贷款支持证券的现金流分布、违约率演化及提前偿付行为,从而构建更为精准的资产池信用风险评估模型。其结构化程度高、时间序列连续且来源权威,使之成为分析ABS底层资产表现、开展压力测试与信用评级校准的基准数据集。
解决学术问题
该数据集填补了SEC新规ABS-EE格式下汽车贷款资产级数据公开可获取的空白,解决了过去学术界因资产池信息不透明而难以深入刻画证券化贷款微观风险特征的困境。通过披露每笔贷款的还款状态、地域分布与信用评级等关键属性,研究者能够系统性地检验信息不对称理论在证券化市场中的具体表现,量化贷款发起标准与后续违约之间的因果关系。此外,数据集支持构建动态面板数据模型,用于识别宏观经济波动对底层资产质量的冲击路径,为理解证券化金融中介的风险承担行为提供了经验证据,推动了资产定价、金融稳定与行为金融学等领域的实证研究。
衍生相关工作
基于该数据集的标准化格式与SEC合规属性,衍生出多项推动金融数据科学发展的经典工作。一方面,研究者开发出自动化的资产级数据解析与清洗流水线,将XML格式的SEC申报文件高效转化为可分析的DataFrame,这类工具已被整合到开源金融数据框架中,降低了后续学者获取和处理ABS数据的门槛。另一方面,针对数据集中的贷款绩效字段,催生了多篇关于使用机器学习方法预测证券化贷款违约概率的论文,部分工作将文本挖掘技术应用于发行人披露文件,拓展了传统信用风险建模的变量维度。此外,该数据集还支撑了关于ABS-EE新规对市场信息效率影响的事件研究,成为评估监管政策效果的实证基石。
以上内容由遇见数据集搜集并总结生成



