DenyTranDFW/Ally_Auto_Receivables_Trust_2022_1_1922474
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Ally_Auto_Receivables_Trust_2022_1_1922474
下载链接
链接失效反馈官方服务:
资源简介:
SEC ABS-EE资产级别备案数据集,涉及CIK 1922474(Ally Auto Receivables Trust 2022-1)。包含31个备案文件,31个Parquet文件,总大小为121.1 MB,报告期为2022-03-31至2025-05-31。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。
SEC ABS-EE asset-level filings for CIK 1922474 (Ally Auto Receivables Trust 2022-1). Includes 31 filings, 31 parquet files, total size of 121.1 MB, reporting period from 2022-03-31 to 2025-05-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
Ally Auto Receivables Trust 2022-1数据集源自美国证券交易委员会(SEC)的ABS-EE(Asset-Backed Securities Exchange Electronic)监管备案系统。该数据集针对CIK编号为1922474的发行人,系统性地收集了其从2022年3月31日至2025年5月31日期间提交的共计31份资产层面XML备案文件。这些原始XML文件经过专业解析,提取出每一笔贷款的细粒度资产级数据,并按照统一的格式转换为Parquet文件。每个文件名以“备案号/展品名称.parquet”的结构组织,便于检索与关联,从而构建起一个结构化、可复用的资产支持证券数据库。
特点
该数据集最显著的特点在于其高度的标准化与规模性,包含了31个Parquet文件,总数据量达121.1 MB,完整覆盖了三年以上的连续报告周期。每份文件均对应一个具体的报告月份,且数据来源明确,相关报告日期由XML中的reportingPeriodEndingDate字段准确标注。数据的资产级粒度使得研究者或分析师能够深入到单笔贷款的层面进行风险定价、现金流预测或违约率建模。此外,数据集以Parquet这种列式存储格式呈现,具备高效的压缩与查询性能,尤为适合大数据环境下的高频计算任务。
使用方法
用户可通过HuggingFace Datasets库或Pandas等工具直接加载该数据集中的Parquet文件。每个文件对应一次ABS-EE备案,文件名中的accession_nodash标识了具体的监管备案编号,便于与SEC官网的原始XML文件及其他公开信息进行交叉验证。在实际应用中,研究人员可按reportDate字段筛选特定月份的数据进行分析,亦可利用多份文件进行时间序列比较,评估汽车贷款资产池的信用表现。数据集的GPL许可证允许在学术与商业场景中自由使用,但需遵循相应的开源协议规范。
背景与挑战
背景概述
Ally Auto Receivables Trust 2022-1 数据集由美国证券交易委员会(SEC)依据ABS-EE规则创建,旨在系统化收集资产支持证券(ABS)领域中汽车贷款抵押债券的逐笔贷款层面数据。该数据集以中央索引密钥(CIK)1922474标识,涵盖自2022年3月至2025年5月期间的31份资产层级备案文件,总规模达121.1 MB。其核心研究问题在于为金融市场监管、风险评估及资产证券化研究提供透明、精细化的微观数据支撑,对于理解汽车贷款违约模式、资产池表现及证券化产品定价机制具有重要价值。作为SEC推动结构化金融数据标准化的重要成果,该数据集为学术界和业界深入探索资产证券化市场的内在规律与风险演化提供了可靠基准。
当前挑战
该数据集所解决的领域挑战在于,传统资产证券化领域长期面临资产池信息不透明、逐笔贷款数据难以获取的窘境,导致风险定价失真与市场监管盲区。Ally Auto Receivables Trust 2022-1 通过标准化XML格式与Parquet文件存储,将高频的贷款级别还款、逾期及违约数据转化为可计算结构,为系统性风险监测提供了实证基础。然而,构建过程中面临多重挑战:首先,从非结构化SEC原始备案中精准提取并解析海量XML exhibit,需处理标签歧义与格式不一致问题;其次,确保跨时间序列(reportingPeriodEndingDate)数据的一致性与完整性,避免因缺失或重复填报引发的偏差;最后,将分散的资产级数据整合为适合机器学习的分析格式,要求同时兼顾数据压缩效率与查询性能,这对数据处理管道的鲁棒性提出了严苛要求。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,Ally Auto Receivables Trust 2022-1 数据集凭借其详尽的贷款层面资产级信息,成为剖析汽车贷款证券化产品运作机制的经典工具。该数据集涵盖了从2022年3月至2025年5月期间共31期月度ABS-EE申报文件,每份文件均以Parquet格式存储了底层贷款的完整表现数据。研究者借助这一资源,能够对汽车贷款池的信用质量、提前偿付行为、违约分布等核心指标展开细粒度的时序分析,从而构建更为精准的现金流预测模型与风险评估框架。
衍生相关工作
该数据集催生了一系列具有影响力的衍生研究。例如,有学者基于其贷款级数据构建了多期动态违约模型,揭示了汽车ABS中借款人区域集中度与损失严重度的非线性关系;另一些工作则利用该数据集检验了机器学习方法在结构化产品现金流预测中的表现,并提出了融合图神经网络的证券化偿付网络分析框架。此外,该数据集还被用于开发自动化信息披露合规核查工具,推动了金融科技在监管科技(RegTech)领域的应用边界。
数据集最近研究
最新研究方向
在资产支持证券(ABS)领域,Ally Auto Receivables Trust 2022-1数据集为研究汽车贷款资产池的逐笔贷款表现提供了珍贵的数据资源。当前前沿方向聚焦于利用美国证券交易委员会(SEC)ABS-EE强制披露的资产级XML数据,通过机器学习与违约预测模型,深入分析贷款池的信用风险演化、提前偿付行为及宏观压力情景下的资产质量波动。该数据集覆盖2022年至2025年间31个报告期的月度连续观测,衔接了后疫情时代汽车金融市场的利率上升与消费信贷收缩热点,不仅增强了结构化产品定价模型的透明度基准,更推动了金融监管科技(RegTech)在资产证券化领域的实证应用,对理解信用传导机制与系统性风险缓释具有显著意义。
以上内容由遇见数据集搜集并总结生成



