DenyTranDFW/Santander_Drive_Auto_Receivables_Trust_2022_5_1941255
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Santander_Drive_Auto_Receivables_Trust_2022_5_1941255
下载链接
链接失效反馈官方服务:
资源简介:
Santander Drive Auto Receivables Trust 2022-5数据集包含SEC ABS-EE资产级别文件,针对CIK 1941255。数据集包括35份文件,98个Parquet文件,总大小为390.0 MB,报告期从2022-07-31至2026-03-31。Parquet文件是从XML展示中提取的贷款级别数据,按accession_nodash和exhibit_name组织。文件索引提供了每份文件的详细信息,包括CIK、表格类型、accessionNumber、reportDate和URL。
SEC ABS-EE asset-level filings for CIK 1941255 (Santander Drive Auto Receivables Trust 2022-5). The dataset includes 35 filings, 98 Parquet files, totaling 390.0 MB, with a reporting period from 2022-07-31 to 2026-03-31. Parquet files are loan-level data extracted from XML exhibits, organized as {accession_nodash}/{exhibit_name}.parquet. The filing index provides details on each filing, including cik, form, accessionNumber, reportDate, and url.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
桑坦德汽车应收款信托2022-5数据集源自美国证券交易委员会(SEC)的ABS-EE资产层级申报文件,聚焦于中央索引键(CIK)为1941255的特定资产支持证券项目。该数据集系统性地采集了自2022年7月至2026年3月期间共计35份申报文件,通过从XML展品中提取贷款级别或资产级别的结构化数据,最终生成98个Parquet格式文件,总量达390.0 MB。数据按申报编号与展品名称进行组织,报告周期日期基于资产层XML中的`reportingPeriodEndingDate`字段自动派生,确保了时间维度的精确对齐与数据的完整可追溯性。
使用方法
用户可通过HuggingFace平台便捷访问该数据集,利用Python环境中的`datasets`库直接加载Parquet文件,或通过`pandas`等数据分析工具进行进一步处理。数据以`{accession_nodash}/{exhibit_name}.parquet`的路径结构存储,用户可按需读取特定报告周期或展品的子集。推荐结合SEC EDGAR的原始XML文件进行异构数据源分析,以挖掘更丰富的上下文信息。对于大规模金融建模任务,可借助分布式计算框架如Dask或Spark对390 MB的数据进行高效并行处理,从而支撑资产池违约率、提前偿付率等复杂指标的测算。
背景与挑战
背景概述
Santander Drive Auto Receivables Trust 2022-5(SDART 2022-5)是一个专注于汽车贷款资产支持证券(ABS)领域的结构化金融数据集,由美国证券交易委员会(SEC)依据ABS-EE规则强制披露的贷款级数据构建而成。该数据集涵盖了自2022年7月31日至2026年3月31日的35份备案文件,包含98个Parquet文件,总容量达390.0 MB,详细记录了每笔汽车贷款的逐笔特征与绩效表现。作为桑坦德银行旗下特定资产池的证券化项目,该数据集为研究次级汽车贷款的风险定价、现金流建模及提前偿付行为提供了无与伦比的微观数据支撑,对推动金融监管科技与结构化产品透明化研究具有里程碑意义。
当前挑战
该数据集面临的核心挑战在于处理高维异构的贷款级时间序列数据,以精准建模违约风险与资金池现金流分布,这是传统ABS分析中因数据稀疏而长期难以攻克的领域难题。从构建过程来看,挑战主要体现在:其一,需从SEC EDGAR系统中35份不同XML附件中提取标准化字段,克服不同备案日期间数据格式的微小差异;其二,近4年的报告周期跨越了利率市场剧烈波动与宏观经济周期,如何控制外部冲击对资产池效能的污染效应成为数据清洗的难点;其三,98个Parquet文件以备案号与附件名双重索引组织,构建跨时间层面的一致性键值对日志极具工程复杂度。
常用场景
经典使用场景
Santander_Drive_Auto_Receivables_Trust_2022_5_1941255 数据集聚焦于资产支持证券(ABS)领域,其核心场景在于为汽车贷款证券化产品的结构与表现研究提供细颗粒度的逐笔贷款数据。通过整合美国证券交易委员会(SEC)ABS-EE表格中的XML附件,该数据集将35份申报文件转化为98个Parquet格式文件,覆盖从2022年7月至2026年3月的完整报告周期。研究者可借此剖析汽车贷款资产池的异质性特征、现金流分配机制以及证券化产品的动态信用表现,从而构建更为精准的资产定价与风险模型。
解决学术问题
该数据集在学术层面破解了传统ABS研究中数据颗粒度不足与时间跨度有限的难题。它使得学者能够深入探究汽车贷款证券化中的信息不对称问题,例如如何从逐笔贷款层面识别提前偿付风险与违约驱动因子,并评估结构化分档对风险传导的影响。同时,数据集为检验法律与监管框架(如SEC披露要求)对市场效率的促进效应提供了实证基础,其意义在于推动资产证券化透明度与金融稳定性理论的量化验证。
实际应用
在实际应用中,该数据集可服务于金融机构的风险管理与监管合规场景。例如,评级机构可基于逐笔贷款历史表现校准信用评级模型,优化对Santander系列信托产品的违约损失分布预测。投资经理则能通过分析资产池的异质性现金流特征,辅助构建针对汽车ABS的交易策略,包括收益率曲线套利与提前偿付风险对冲。此外,数据集为SEC及自律监管机构提供了自动化审查工具的训练基础,用以监测贷款质量恶化或披露异常,提升市场监督的实时性与精确度。
数据集最近研究
最新研究方向
在资产证券化(ABS)领域,Santander Drive Auto Receivables Trust 2022-5数据集为分析汽车贷款支持证券的底层资产表现提供了宝贵窗口。依托美国证券交易委员会(SEC)的ABS-EE监管披露框架,该数据集收录了从2022年7月至2026年3月间35份申报文件与98个Parquet文件,涵盖单笔贷款级别的详细数据。当前前沿研究方向聚焦于利用机器学习和时间序列模型,预测贷款池的违约风险、提前偿付率及现金流波动,以应对利率环境变迁与宏观经济不确定性。该数据集推动了ABS市场透明度的提升,支持学者与从业者构建更精准的信用风险评估体系,特别是在次级汽车贷款领域的热点讨论中,其精细资产层级信息助力于量化压力情景下的证券化产品韧性,对监管科技(RegTech)演进与金融稳定性评估具有深远意义。
以上内容由遇见数据集搜集并总结生成



