DenyTranDFW/GM_Financial_Consumer_Automobile_Receivables_Trust_2025_3_2071240
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/GM_Financial_Consumer_Automobile_Receivables_Trust_2025_3_2071240
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含GM Financial Consumer Automobile Receivables Trust 2025-3的SEC ABS-EE资产级别文件。数据包括11个文件,总大小为21.3 MB,报告期为2025年5月31日至2026年2月28日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,并按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。
SEC ABS-EE asset-level filings for CIK **2071240** (GM Financial Consumer Automobile Receivables Trust 2025-3). The dataset includes 11 filings, 11 parquet files, with a total size of 21.3 MB, covering the reporting period from 2025-05-31 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as `{accession_nodash}/{exhibit_name}.parquet`. Reporting-period dates are derived from the asset-level XML (`reportingPeriodEndingDate`).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)体系,聚焦于GM Financial Consumer Automobile Receivables Trust 2025-3这一特殊目的载体。数据构建方式为从SEC EDGAR系统中提取CIK编号为2071240的实体所提交的11份ABS-EE申报文件,并对其中的XML展品(exhibit)进行解析,抽取出贷款层面(loan-level)或资产层面(asset-level)的微观数据。每份XML展品均包含关键的报告期末日期(reportingPeriodEndingDate),数据被统一转换为Parquet格式文件,并按照“档案号(去除连字符)/展品名称.parquet”的层级结构进行组织,最终形成了总计21.3 MB、覆盖2025年5月至2026年2月共计10个报告周期的结构化资产级数据集。
特点
该数据集的核心特点在于其高度的标准化与精细化。所有数据均严格遵循SEC ABS-EE的XML Schema规范,确保了字段定义与数据类型的统一性,为跨期、跨资产池的对比分析提供了坚实基础。数据以Parquet列式存储格式呈现,相较于传统的CSV或JSON格式,具有极高的压缩比与查询效率,尤其适合处理金融领域中涉及大量数值型字段的资产池逐笔数据。此外,该数据集按月度频率进行申报更新,完整覆盖了从信托设立到存续期管理的全生命周期,为研究汽车贷款应收款资产池的信用表现、提前偿付率、损失分布等核心指标提供了连续且详实的时间序列面板数据。
使用方法
用户可通过Pandas、DuckDB或Apache Spark等支持Parquet格式的数据分析工具直接读取并处理该数据集。使用时,首先将各月份的Parquet文件按时间顺序或业务逻辑进行合并与聚合,构建出一个完整的资产池面板数据。研究人员可依据SEC定义的XML标签名称(如贷款余额、逾期天数、地理区域等)作为列名,对贷款进行分组统计或构建违约预测模型。对于希望深入挖掘的金融分析者,还可将本数据集与其他公开的SEC申报文件(如交易结构文件、服务商报告)进行交叉关联,从而在资产层面与交易结构层面建立完整的分析框架,支持复杂的现金流水文分析与压力测试场景。
背景与挑战
背景概述
GM Financial Consumer Automobile Receivables Trust 2025-3数据集源于美国证券交易委员会(SEC)的ABS-EE强制披露要求,由通用汽车金融服务公司(GM Financial)旗下的特殊目的载体于2025年创建,旨在提供汽车贷款资产支持证券(ABS)的逐笔贷款层面数据。该数据集涵盖2025年5月至2026年2月间的11份申报文件,总容量达21.3 MB,以Parquet格式存储从XML附件中提取的资产级信息。其核心研究问题聚焦于提升ABS市场的透明度和数据可获取性,为投资者、监管机构及量化研究者提供标准化的结构化金融产品分析基础。作为SEC EDGAR系统的重要衍生数据集,它推动了资产证券化领域的实证研究,尤其在违约预测、现金流转付及风险定价等方向具有显著影响力,弥补了传统公开数据在细粒度颗粒度上的不足。
当前挑战
该数据集所解决的领域问题核心在于资产支持证券市场长期存在的信息不对称困境,尤其针对汽车贷款ABS的高异质性资产池,传统披露方式难以支持精确的逐笔资产风险建模。通过将分散于XML格式的监管申报文件转化为结构化Parquet数据,构建过程面临多重挑战:首先,需要从SEC EDGAR海量非标准化文档中精准提取XML附件,避免遗漏或解析错误;其次,不同申报周期内文件格式的细微变异要求设计鲁棒的字段映射规则;最后,时间跨度跨越11个月份的数据一致性维护(如日期格式、缺失值处理)增加了清洗复杂度。这些步骤共同保障了数据在资产级违约率测算、提前偿付模型训练等应用中的可靠性与可复现性。
常用场景
经典使用场景
在资产支持证券(ABS)领域,GM Financial Consumer Automobile Receivables Trust 2025-3数据集常被用于构建和验证信贷风险预测模型。研究者利用其提供的逐笔贷款级数据,涵盖借款人特征、贷款条款及还款表现等细粒度信息,通过逻辑回归或机器学习方法预测违约概率与损失严重性。此外,该数据集亦支持资产池现金流分析,模拟不同经济情景下证券化的偿付结构,为ABS定价与信用评级提供实证基础。其丰富的时序记录更便于动态监测资产池质量演变,成为结构化金融研究中的基准数据源。
解决学术问题
该数据集有效解决了资产证券化研究中微观数据匮乏的困境,尤其填补了汽车贷款ABS领域公开、标准化资产级信息的空白。借助这些详尽的数据,学术界得以深入剖析提前还款行为与信用风险的关联机制,量化宏观经济波动对贷款绩效的冲击,并验证现有评级模型的准确性。它推动了关于信息不对称与证券化产品透明度的理论探讨,为监管层优化ABS披露规则提供了关键统计支撑,提升了市场风险的评估能力。
衍生相关工作
围绕此数据集衍生出一系列经典研究,包括基于多任务学习的提前还款与违约联合预测模型,以及利用图神经网络建模贷款间关联性的资产池风险传播分析。部分工作聚焦于可解释性AI在ABS评级中的应用,通过SHAP值解析影响证券分级的关键属性。另有学者将其与美国劳工统计局数据结合,构建宏观-微观联动预警系统。这些研究不仅提升了结构化产品的定量分析水平,也推动了金融机器学习方法论的演进,成为领域内后续创新的重要基石。
以上内容由遇见数据集搜集并总结生成



