five

DenyTranDFW/AmeriCredit_Automobile_Receivables_Trust_2022_2_1929381

收藏
Hugging Face2026-05-28 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/AmeriCredit_Automobile_Receivables_Trust_2022_2_1929381
下载链接
链接失效反馈
官方服务:
资源简介:
AmeriCredit Automobile Receivables Trust 2022-2数据集包含SEC ABS-EE资产级别文件,针对CIK 1929381。数据集包含47个文件,均转换为Parquet格式,总大小为156.5 MB。数据时间跨度为2022年4月30日至2026年2月28日。Parquet文件按accession number和exhibit名称组织,从XML展品中提取,包含贷款级别/资产级别数据。报告周期日期从资产级别XML中派生。README还提供了详细的文件索引,包括CIK、表格类型、accession number、报告日期和每个文件的URL。

The AmeriCredit Automobile Receivables Trust 2022-2 dataset contains SEC ABS-EE asset-level filings for CIK 1929381. The dataset includes 47 filings, each converted into Parquet files, totaling 156.5 MB. The data spans from April 30, 2022, to February 28, 2026. The Parquet files are organized by accession number and exhibit name, extracted from XML exhibits, and include loan-level/asset-level data. The reporting period dates are derived from the asset-level XML. The README also provides a detailed filing index with CIK, form type, accession number, report date, and URL for each filing.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在资产支持证券(ABS)领域,AmeriCredit Automobile Receivables Trust 2022-2 数据集聚焦于美国证券交易委员会(SEC)披露的ABS-EE资产层级信息。该数据集通过系统性地爬取并解析CIK代码为1929381的信托基金自2022年4月至2026年2月期间提交的47份ABS-EE季度备案文件构建而成。每份备案文件中的XML附件被提取并转化为Parquet格式,每个文件对应一个特定的报告周期,数据文件以“{accession_nodash}/{exhibit_name}.parquet”的路径结构组织,确保资产层级数据的结构化存储与可追溯性。
特点
该数据集的显著特征在于其全面性与时序性,覆盖了长达近四年的47个连续报告周期,提供了从信托设立到存续期结束的完整资产表现视图。所有数据均源自SEC官方EDGAR系统的原始XML附件,保证了信息的权威性和合规性。数据集以高效的Parquet格式存储,总计156.5 MB,便于大规模数据处理与分析。每份文件均包含精细的贷款级数据,并且报告日期由XML中的“reportingPeriodEndingDate”字段直接提取,确保了时间戳的精确对齐。
使用方法
研究人员与数据分析师可直接通过加载Parquet文件来运用该数据集。每个Parquet文件代表一个特定报告月份的资产池表现,用户可根据自身需求按时间序列合并分析,以追踪贷款组合的违约率、提前还款率、损失分布等关键指标随时间变化的动态。数据集适用于构建ABS定价模型、信用风险评估以及监督学习任务,亦可用于对比不同信托的资产表现。推荐使用Python中的pandas或Dask库进行高效的数据读取与处理,并可通过文件路径中的报告日期字段进行数据筛选与切片。
背景与挑战
背景概述
AmeriCredit Automobile Receivables Trust 2022-2(CIK 1929381)数据集由美国证券交易委员会(SEC)的资产支持证券结构化数据(ABS-EE)项目于2022年创建,旨在提供汽车贷款证券化产品的逐笔贷款级数据。该数据集涵盖了从2022年4月至2026年2月的47份月度申报文件,总规模约156.5 MB,以Parquet格式存储,来源于SEC EDGAR系统中的XML展品。作为资产支持证券(ABS)领域的重要公开数据集,它为研究汽车贷款池的信用风险、提前偿付行为及证券化结构提供了高粒度、标准化的数据基础,推动了金融科技与监管科技在结构化金融产品分析中的发展。
当前挑战
该数据集所面临的挑战首先体现在领域问题层面:传统汽车ABS分析依赖于汇总数据,难以捕捉单笔贷款的异质性风险,而本数据集虽提供了逐笔贷款信息,但如何从这些高维时序数据中有效提取违约与提前偿付的预测特征仍是一大难题。在构建过程中,数据的解析与整合面临显著困难:XML展品格式各异,需从中准确抽取贷款级字段并统一为结构化格式;同时,47个月度申报文件的跨期一致性验证、缺失值处理以及不同证券化信托之间的数据对齐,均对自动化处理流程提出了严格要求。
常用场景
经典使用场景
AmeriCredit Automobile Receivables Trust 2022-2 数据集是资产支持证券(ABS)领域中,针对汽车贷款证券化产品的经典细颗粒度数据资源。该数据集源自美国证券交易委员会(SEC)的ABS-EE申报文件,提供了自2022年4月至2026年2月期间,以月度频率更新的逐笔贷款级别资产信息。研究者常利用该数据集构建汽车贷款违约预测模型、分析贷款组合的信用风险演变趋势,或评估不同经济周期下证券化资产池的绩效表现。其高时间分辨率和详尽的资产属性,使其成为实证资产定价、结构化金融产品风险评估以及监管科技(RegTech)领域研究的基石性数据源。
实际应用
在实际金融业务中,该数据集被广泛运用于信用风险评估模型的训练与验证,助力金融机构优化贷款审批策略和资本计提方案。评级机构可借助其历史表现数据校准评级模型,更精准地衡量汽车ABS的违约概率与损失严重性。同时,资产管理公司与对冲基金利用这些贷款级别的表现数据,构建基于机器学习的套利策略,识别被错误定价的证券化产品。监管层则依赖此类高频、透明的数据集开展压力测试,实时监控系统性风险在影子银行体系中的累积与传导路径。
衍生相关工作
以AmeriCredit Automobile Receivables Trust 2022-2为代表的数据集,催生了一系列富有影响力的衍生研究。基于其贷款级别时序数据,研究者开发了融合宏观经济指标与微观资产特征的混合生存分析模型,显著提升了对汽车ABS违约风险的预测精度。另一方面,利用该数据集的逐笔信息披露,学术界构建了自动化信用事件提取与结构化产品现金流模拟框架,实现了对复杂ABS架构的透明化解析。这些工作还启发了跨数据集的比较研究,通过整合同一信托在不同申报期的分笔数据,系统揭示了贷款账龄、合同条款与损失严重性之间的非线性关联,推动了结构化金融计量方法的迭代革新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作