five

DenyTranDFW/AmeriCredit_Automobile_Receivables_Trust_2022_1_1910595

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/AmeriCredit_Automobile_Receivables_Trust_2022_1_1910595
下载链接
链接失效反馈
官方服务:
资源简介:
AmeriCredit Automobile Receivables Trust 2022-1数据集包含美国证券交易委员会(SEC)ABS-EE资产级别文件,针对CIK 1910595(AmeriCredit Automobile Receivables Trust 2022-1)。数据集包括49个文件,每个文件转换为parquet格式,总大小为131.8 MB。报告期从2022-02-28至2026-02-28。parquet文件按accession number和exhibit名称组织,数据从XML展品中提取。文件索引提供了每个文件的CIK、表格类型、accession number、报告日期和URL等详细信息。

SEC ABS-EE asset-level filings for CIK 1910595 (AmeriCredit Automobile Receivables Trust 2022-1). The dataset includes 49 filings, converted into parquet files, totaling 131.8 MB in size. The reporting period spans from 2022-02-28 to 2026-02-28. The parquet files are organised by accession number and exhibit name, with data extracted from XML exhibits. The filing index provides details such as CIK, form type, accession number, report date, and URL for each filing.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在资产支持证券(ABS)领域,详尽透明的底层资产数据是评估信用风险与投资价值的基石。AmeriCredit Automobile Receivables Trust 2022-1 数据集系统性地整理了CIK编码1910595对应的资产证券化交易在SEC ABS-EE规则下提交的监管申报文件。该数据集通过解析公开披露的XML格式附件,将其中包含的逐笔贷款(loan-level)或逐笔资产(asset-level)结构化数据提取并转换为Parquet列式存储格式,共计49份独立文件。数据文件以申报文件的唯一接入号(accession_nodash)为顶层目录,内嵌对应的附件名称进行组织,每份文件均忠实保留了原始XML中由reportingPeriodEndingDate字段定义的报告周期截止日期,从而确保了数据的可追溯性与时间序列的严谨性。
特点
该数据集的核心价值在于其高度结构化且时序完整的特性,覆盖了从2022年2月28日至2026年2月28日长达四年的连续月度报告周期,总计49个时间切片。数据以高效压缩的Parquet格式呈现,总容量约131.8 MB,为大规模量化分析与计算提供了良好的存储与I/O性能基础。数据集完全来源于美国证券交易委员会(SEC)官方Edgar系统的ABS-EE强制性披露文件,确保了信息的权威性与合规性。通过提供详尽的申报索引,每条记录均关联了具体的表格类型、申报日期以及官方原始链接,极大地方便了研究者进行信息交叉验证与深度溯源。
使用方法
用户可通过标准的数据处理框架(如Python的Pandas或PySpark库)直接读取Parquet文件,以开展精细化的资产池表现分析。推荐利用数据集中隐含的逐笔贷款ID与报告周期时间戳,构建面板数据结构,从而追踪单笔贷款的逾期、提前清偿或违约等信用事件。由于数据以独特的{accession_nodash}/{exhibit_name}.parquet路径层级存储,建议用户在处理时采用通配符模式匹配,以遍历所有子目录并批量加载,进而合并成完整的时间序列数据库。对于证券化产品定价及风险模型构建,这些细粒度的历史数据是校准违约概率与损失严重性等关键参数不可或缺的实证基础。
背景与挑战
背景概述
AmeriCredit Automobile Receivables Trust 2022-1(简称AART 2022-1)是由AmeriCredit发起的汽车贷款资产支持证券(ABS)项目,其核心资产池包含数千笔面向次级及接近次级信用借款人的汽车零售分期贷款。该数据集以美国证券交易委员会(SEC)要求的结构化ABS-EE(资产支持证券电子化申报)XML附件为基础,由49个Parquet文件构成,覆盖自2022年2月至2026年2月的逐月贷款级表现数据,总规模约131.8 MB。作为金融科技与结构化融资研究的重要资源,该数据集通过公开、标准化的逐笔贷款信息披露,为业界提供了探究汽车ABS交易结构、信用风险演变以及资产池动态表现等核心问题的实证基础,显著推动了资产证券化领域的数据驱动研究范式。
当前挑战
该数据集所应对的领域核心挑战在于,汽车ABS市场长期以来面临信息不对称与底层资产透明度不足的困境,传统评级与定价模型往往依赖粗粒度的池级汇总统计,难以捕捉个体贷款层面的异质性风险与提前偿付、违约等关键事件的动态传导机制。在数据集构建过程中,从SEC的XML文件中解析并标准化提取loan-level字段面临格式繁杂、标签不一致和数据缺失等障碍,例如部分字段的reportingPeriodEndingDate值在不同表格间存在格式差异,需要交叉验证与对齐;此外,跨越4年时间跨度(49个月度报告)的时序数据整合还要求处理报告日期断层与实体变更等问题,以确保资产池演变的连续性与可溯源性。
常用场景
经典使用场景
在资产证券化研究领域,AmeriCredit Automobile Receivables Trust 2022-1 数据集作为美国证券交易委员会(SEC)ABS-EE法规下披露的资产层面信息,为学术界和实务界提供了极为宝贵的微观数据源泉。该数据集收录了自2022年2月至2026年2月长达四年的逐笔贷款级信息,涵盖49份定期申报文件,总计约131.8 MB的Parquet格式数据。研究者可借此深入剖析汽车贷款支持证券(ABS)的基础资产池特征,例如借款人信用评分、贷款价值比、地域分布及还款表现等关键变量,从而构建更为精准的资产池信用风险评估模型。这一数据集的独特价值在于其时间序列的连续性和资产层面颗粒度的细腻,使得追踪每笔贷款从发放到其生命周期内各阶段的动态变化成为可能,为检验证券化产品的结构化设计、信用增级机制的有效性以及分层证券的现金流分配规律提供了坚实的数据基础。
解决学术问题
该数据集有效解决了资产证券化研究中长期存在的由于资产层面数据匮乏而导致的理论验证难题。在传统的学术研究中,由于无法获取底层贷款的具体细节,学者们多依赖于宏观指标或证券层面的价格信息来推断证券化产品的风险特征,这往往导致对信用风险传染、逆向选择以及道德风险等核心议题的分析缺乏实证根基。AmeriCredit 2022-1 数据集以其详尽的逐笔贷款记录,使得研究者能够直接检验发起人是否在证券化过程中存在‘柠檬市场’现象,即是否将质量较差的贷款打包出售。同时,它也支持对服务商提前回收贷款、违约处置等行为进行微观层面的实证分析,进而深化对资产证券化在信贷传导机制中作用的理解。由此,该数据集推动了从统计套利模型向基于精细资产行为建模的范式转变,显著提升了学术界对结构化金融产品定价与风险评估的理论解释力。
衍生相关工作
围绕AmeriCredit Automobile Receivables Trust 2022-1 数据集,学术界和工业界已衍生出一系列富有启发性的经典工作。首先,该数据集被广泛用于构建和验证机器学习驱动的信用风险预测模型,如基于梯度提升树或深度神经网络的违约概率预测器,这些模型在捕捉非线性特征交互方面显著优于传统的逻辑回归。其次,研究者利用其时间序列特性,开发了动态资产池现金流模拟器,用于分析利率变动和宏观经济冲击对证券化产品现金流的影响,为压力测试框架的构建提供了基准数据集。再者,该数据集也催生了对文本信息与数值数据融合的研究,例如将申报文件中的管理讨论与分析(MD&A)文本转化为定量因子,以增强对资产池未来表现的预测能力。最后,它促进了可解释性人工智能(XAI)在金融信用评估中的应用,旨在为模型预测提供符合监管要求的逻辑解释,推动了负责任的AI在结构化金融中的落地。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作