DenyTranDFW/AmeriCredit_Automobile_Receivables_Trust_2021_1_1843443
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/AmeriCredit_Automobile_Receivables_Trust_2021_1_1843443
下载链接
链接失效反馈官方服务:
资源简介:
AmeriCredit Automobile Receivables Trust 2021-1数据集包含SEC ABS-EE资产级别备案文件,针对CIK 1843443(AmeriCredit Automobile Receivables Trust 2021-1)。数据集包含54个备案文件,每个文件转换为parquet格式,总大小为221.5 MB。报告期从2021-01-31至2025-05-31。parquet文件按accession number和exhibit名称组织,报告期日期从资产级别XML中提取。备案索引提供了每个备案的详细信息,包括CIK、表格类型、accession number、报告日期和URL。
SEC ABS-EE asset-level filings for CIK 1843443 (AmeriCredit Automobile Receivables Trust 2021-1). The dataset includes 54 filings, each converted into parquet files, totaling 221.5 MB. The reporting period spans from 2021-01-31 to 2025-05-31. The parquet files are organised as {accession_nodash}/{exhibit_name}.parquet, and the reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate). The filing index provides detailed information about each filing, including CIK, form type, accession number, report date, and URL.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
本数据集聚焦于AmeriCredit Automobile Receivables Trust 2021-1(CIK编号1843443)的资产支持证券(ABS)领域,其构建基于美国证券交易委员会(SEC)ABS-EE监管文件中的资产级数据。具体而言,数据集从54份ABS-EE表格的XML附件中提取贷款层面信息,并将这些原始XML数据转换为Parquet格式文件。每个Parquet文件以访问编号和附件名称的层级结构组织,如{accession_nodash}/{exhibit_name}.parquet,同时从XML中解析出报告期结束日期(reportingPeriodEndingDate)作为时间维度标识。整个数据集包含54个Parquet文件,总大小达221.5 MB,覆盖从2021年1月31日至2025年5月31日的完整报告周期,确保了资产池动态变化的系统记录。
特点
该数据集的核心特征在于其高颗粒度的资产级数据呈现,提供了汽车贷款应收款信托中每笔贷款的详细状态信息,为资产支持证券的绩效分析奠定了坚实微观基础。其时间跨度长达近四年半,包含53个连续报告月份,能够清晰刻画资产池的长期演变趋势和季节性波动规律。数据以Parquet列式存储格式保存,兼具高效的压缩比和快速查询性能,特别适合处理大规模的金融时序数据。此外,数据集与SEC官方文件直接挂钩,每份文件均附有对应的EDGAR访问URL,确保了数据的可追溯性和监管合规性。
使用方法
使用本数据集时,研究人员可通过Hugging Face平台直接下载整个数据集或按需访问单个Parquet文件。推荐借助Python生态中的Pandas或Dask等库进行数据加载与分析,利用Parquet格式的列式存储特性高效筛选特定字段或时间范围。针对证券化产品研究,用户可依据报告期结束日期合并不同月份的数据,构建动态面板数据集,进而分析贷款违约率、提前还款率及损失严重程度等关键指标。数据集还支持与SEC EDGAR原始XML进行交叉验证,确保分析结果的准确性。对于需要量化ABS产品风险和收益的金融建模场景,这是一个极具价值的结构化数据来源。
背景与挑战
背景概述
AmeriCredit Automobile Receivables Trust 2021-1 数据集由 SEC(美国证券交易委员会)依据 ABS-EE(资产支持证券电子化申报)制度收录,对应于中央索引键(CIK)1843443,涵盖自2021年1月至2025年5月期间共54份月度申报文件。该数据集聚焦于汽车贷款支持证券的逐笔资产级信息披露,旨在提升资产支持证券(ABS)市场的透明度与可分析性。作为美国汽车金融领域的重要证券化产品,该信托由 AmeriCredit 发起并管理,其底层资产为零售汽车贷款合同。这一数据集的建立为信用风险建模、资产池绩效追踪以及监管合规研究提供了宝贵的结构化数据基础,在金融科技与固定收益研究中具有广泛应用潜力。
当前挑战
该数据集所解决的领域问题在于,传统 ABS 市场信息不对称问题严重,投资者难以获取标准化、高频次的资产级数据,从而影响对证券化产品信用风险的精准评估。针对这一困境,数据集通过提供 XML 格式的逐笔贷款数据并将其转换为 Parquet 格式,极大提升了数据的可处理性与可复现性。然而,构建过程中面临多重挑战:首先,从 SEC EDGAR 系统中批量抓取并解析非结构化的 XML 附件需要设计健壮的数据管道;其次,不同申报期的数据字段命名与结构可能存在细微差异,需进行严密的清洗与对齐;最后,数据集规模随着时间推移持续增长,对存储与版本管理提出持续要求。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,AmeriCredit Automobile Receivables Trust 2021-1数据集为学者提供了一份难得的微观金融档案。该数据集源自美国证券交易委员会(SEC)的ABS-EE强制披露规则,囊括了2021年1月至2025年5月期间共计54份贷款层面的月度资产表现记录。研究者可通过这些详尽的逐笔贷款数据,精准追溯汽车贷款支持证券的现金流生成、提前偿付行为及违约时序特征,进而构建信贷风险动态评估模型。
解决学术问题
该数据集有效弥合了证券化市场中信息不对称这一长期困扰学界的理论缺口。它使得研究人员得以突破传统聚合数据的局限,直接剖析基础资产池中单笔贷款的异质性表现,从而解决有关贷款信用质量演化、分层证券的触发机制以及结构性风险传染等经典学术问题。围绕这一数据,学者可深入检验信息透明度对定价效率的影响,以及贷款层级特征与损失分布之间的统计关联。
衍生相关工作
AmeriCredit Automobile Receivables Trust 2021-1数据的公开催生了多项衍生研究。例如,有学者利用此类资产级时间序列构建了基于机器学习的提前偿付风险预测模型,或通过对比不同交易池的表现来量化信贷筛选标准在证券化中的角色。另有研究将其与同系列其他年份的交易数据融合,形成面板数据集,以探究宏观经济波动对次贷借款人还款能力的异质性冲击效应。
以上内容由遇见数据集搜集并总结生成



