five

DenyTranDFW/GM_Financial_Consumer_Automobile_Receivables_Trust_2020_4_1823097

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/GM_Financial_Consumer_Automobile_Receivables_Trust_2020_4_1823097
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集涉及GM Financial Consumer Automobile Receivables Trust 2020-4的SEC ABS-EE资产级别申报文件。内容包括50个申报文件,50个Parquet文件,总大小为164.6 MB,报告期从2020年8月31日至2024年8月31日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。申报索引列出了各种申报的详细信息,如CIK、表格、申报号、报告日期和URL。

SEC ABS-EE asset-level filings for CIK **1823097** (GM Financial Consumer Automobile Receivables Trust 2020-4). Includes 50 filings, 50 parquet files, total size of 164.6 MB, reporting period from 2020-08-31 to 2024-08-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. The filing index lists various filings with details like cik, form, accessionNumber, reportDate, and url.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源于美国证券交易委员会(SEC)的ABS-EE强制性资产层级申报文件,聚焦于GM Financial Consumer Automobile Receivables Trust 2020-4(CIK编号1823097)的信贷资产表现。数据提取自50份XML格式的展品附件,经过系统化处理转化为Parquet文件格式,每个文件对应一个申报编号(accession_nodash)下的特定展品名称。数据集覆盖自2020年8月至2024年8月的完整报告周期,每份文件的报告期均源自XML中明确的截止日期字段(reportingPeriodEndingDate),从而构建起一个结构化的贷款级/资产级时间序列数据库。
特点
该数据集以精细的贷款层级颗粒度为核心优势,累计50份Parquet文件总容量达164.6 MB,囊括了汽车贷款应收款在四年间的逐月履约状态。其时间跨度完整,从初始发行月直至2024年8月,能够支持研究者深入追踪资产的逾期、提前还款及违约等动态演变。数据标准化为Parquet格式,兼具高效的压缩存储与快速列式读取能力,且保留了与SEC原始文件一一对应的可追溯性,为资产证券化领域的量化分析提供了扎实的底层数据基础。
使用方法
研究者可通过加载Parquet文件进行结构化分析,支持Python中的Pandas、Dask或Apache Spark等工具进行高效数据处理。每个文件内的字段反映贷款层面的特征,如账龄、余额及还款记录,可直接用于构建还款模型或评估资产池信用风险。由于数据已按报告期自动对齐,用户可便捷地拼接不同月份的快照,形成面板数据以进行时间序列回归。建议结合CIK和报告日期作为关键索引,实现对单一信托产品全生命周期的穿透式研究。
背景与挑战
背景概述
资产支持证券(ABS)作为结构化金融产品的重要组成部分,其信息披露的透明度与标准化程度直接关系到市场的健康运行与风险的精准评估。GM Financial Consumer Automobile Receivables Trust 2020-4 数据集由美国证券交易委员会(SEC)的ABS-EE(Asset-Backed Securities - Electronic Exhibits)项目产生,核心研究问题聚焦于汽车贷款ABS的资产级微观数据挖掘与分析。该数据集覆盖了自2020年8月至2024年8月共计50份资产层面备案文件,总数据量达164.6 MB,由GM Financial Consumer Automobile Receivables Trust 2020-4(CIK 1823097)定期向SEC提交。其发布为金融科技与风险管理领域提供了高颗粒度的汽车贷款偿还、违约与现金流模拟数据,对推动基于机器学习的ABS定价与风险建模研究具有里程碑式的学术与商业价值。
当前挑战
该数据集的核心挑战在于所解决的领域问题与构建过程中的双重复杂性。领域层面,汽车贷款ABS市场长期面临资产池异质性高、提前偿付与违约行为非线性耦合的难题,传统统计模型难以捕捉微观贷款层面波动的动态传导效应,亟需构建能够整合时序与截面特征的深度学习框架以提升风险预测精度。构建过程中,原始XML格式的资产级数据需经精密解析与清洗,同时面临不同报告期间数据模式不一致、缺失值处理及跨期贷款生命周期对齐等工程挑战。此外,50份Parquet文件间的数据结构一致性维护及数据脱敏合规性审查,亦对构建标准化、可复现的高质量金融数据集提出了严峻考验。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,GM Financial Consumer Automobile Receivables Trust 2020-4 数据集为分析汽车贷款支持证券的资产池结构提供了坚实基础。该数据集收录了从2020年8月至2024年8月间50份SEC ABS-EE表格的资产级XML数据,涵盖每笔贷款的逐笔详细信息。研究者可借助这些Parquet格式的标准化数据,深入剖析贷款组合的信用质量、分散化程度及现金流分布特征,从而构建更为精准的资产池风险评估模型。其月频报告周期尤为适合用于时间序列分析,探索贷款表现随宏观环境波动的演化规律。
解决学术问题
该数据集直面资产证券化研究中因数据匮乏而导致的透明度不足问题,解决了传统研究中仅能依赖汇总数据而无法触及微观借贷行为的困境。通过提供细粒度的贷款层面数据,它使学者能够量化分析提前还款风险、违约概率及损失严重度等核心变量,进而修正现有的信用评级模型。这些研究成果不仅促进了资产定价理论的完善,还有助于提升监管机构对ABS产品风险穿透式监控的能力,对推动金融市场的稳定性具有深远影响。
衍生相关工作
围绕该数据集已衍生出多项突破性学术工作,例如,基于其贷款级数据构建的机器学习提前还款预测模型,显著提升了现金流预测的时效性。另有研究利用数据集中时间跨度信息,开发出动态违约强度评估框架,连接了宏观经济指标与个人贷款表现。这些经典工作不仅深化了资产支持证券领域的量化分析手段,还推动了金融科技与结构化金融的交叉融合,为后续研究如何利用大规模监管披露数据开辟了新范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作