five

DenyTranDFW/Santander_Drive_Auto_Receivables_Trust_2024_1_2004812

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Santander_Drive_Auto_Receivables_Trust_2024_1_2004812
下载链接
链接失效反馈
官方服务:
资源简介:
Santander Drive Auto Receivables Trust 2024-1数据集包含美国证券交易委员会(SEC) ABS-EE资产级别备案文件,涉及CIK 2004812(Santander Drive Auto Receivables Trust 2024-1)。数据集包括20个备案文件,20个Parquet文件,总大小为77.2 MB,报告期从2024年8月31日至2026年3月31日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,并按特定方式组织。

SEC ABS-EE asset-level filings for CIK **2004812** (Santander Drive Auto Receivables Trust 2024-1). The dataset includes 20 filings, 20 Parquet files, with a total size of 77.2 MB, covering the reporting period from 2024-08-31 to 2026-03-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as `{accession_nodash}/{exhibit_name}.parquet`.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE备案体系,聚焦于桑坦德银行旗下汽车应收账款信托2024-1(CIK代码2004812)的资产层级披露信息。数据构建过程系统性地抓取了该信托自2024年8月至2026年3月期间的20份电子化备案文件,并从原始XML展品中精准提取了单笔贷款级别的结构化数据,最终以Parquet列式存储格式进行组织。每一份Parquet文件均按照备案编号与展品名称的层级目录结构存放,文件名明确映射至对应的SEC备案号及其内部附件,确保了每一笔资产数据与原始监管申报材料的可追溯性。报告期间的日期字段直接源自XML数据中的'reportingPeriodEndingDate'标签,保证了时间序列信息的标准化与一致性。
特点
本数据集最显著的特征在于其细粒度的资产级粒度与高度的结构化程度,能够为资产支持证券(ABS)的深度量化分析提供坚实基础。其涵盖的20个连续月度报告期构建了一条完整的时间序列,研究者可据此追踪汽车贷款组合的逐月表现、违约率演变及现金流生成动态。数据以高效压缩的Parquet格式存储,兼具优异的查询性能与存储效率,特别适合处理海量金融证券化数据。此外,所有资产层级信息均直接挂钩至SEC官方申报入口,并附带完整的备案索引表格,极大便利了数据验证、审计追踪与跨文件交叉引用,为金融科技、监管科技及结构化金融研究提供了可靠的数据底座。
使用方法
使用者可通过Hugging Face Datasets库中的load_dataset函数直接加载该数据集,实现与主流数据科学工作流的无缝集成。加载后,数据以成熟的DataFrame结构呈现,支持使用Pandas、Dask或PySpark等工具进行高效的数据操控、清洗与探索性分析。Parquet格式的列式存储特性使其在开展条件筛选、聚合统计或时序建模时表现优异。数据集内建的filing index元数据为用户提供了便捷的检索索引,可按报告日期或备案号码精准定位特定时期的资产快照。建议研究者结合SEC EDGAR官方披露的其他补充材料进行联动分析,以构建更为完整的证券化交易生命周期画像。
背景与挑战
背景概述
资产支持证券(ABS)作为结构化金融产品,其透明度和信息披露质量对市场稳定与投资者决策至关重要。Santander Drive Auto Receivables Trust 2024-1数据集由SEC ABS-EE项目发布,聚焦于桑坦德银行旗下汽车贷款证券化信托的资产层级数据。该数据集创建于2024年,覆盖从2024年8月至2026年3月的报告周期,包含20份ABS-EE备案文件及对应Parquet格式的贷款级数据,总容量77.2 MB。其核心研究问题在于通过系统化整理XML附表中的逐笔贷款信息,为金融科技、风险建模及监管合规领域提供标准化的高频数据源。作为SEC推动电子化披露的重要成果,该数据集填补了汽车ABS细粒度数据长期缺失的空白,赋能学术界与业界进行现金流预测、违约率分析及资产池异质性研究,对提高二级市场定价效率具有显著影响。
当前挑战
该数据集面临的核心挑战包括:第一,证券化领域内,汽车贷款ABS的底层资产具有高度异质性,贷款期限、利率、信用评分及地域分布等特征差异显著,亟需细粒度数据以捕捉风险传导机制中的非线性关系,而传统聚合数据难以支撑精准建模。第二,构建过程中,需从SEC EDGAR系统非结构化的XML文件中提取并解析多达20个不同报告期的资产层级信息,面临格式不一致、标签命名冲突及缺失值处理等技术壁垒;同时,将数据统一转化为Parquet格式以压缩存储并加速查询,需兼顾数据完整性与计算效率。此外,跨20期时间序列的连续性与可比性维护,对数据质量控制和版本更新提出了严峻考验。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,Santander_Drive_Auto_Receivables_Trust_2024_1_2004812数据集以其详尽的贷款层面数据,成为剖析汽车贷款支持证券内在机理的经典素材。该数据集通过SEC ABS-EE强制披露的XML附件,提取了20个报告期内的逐笔贷款信息,涵盖从2024年8月至2026年3月的资产表现。研究人员可借此追踪每笔贷款的还款状态、逾期情况、提前偿付行为等微观动态,从而构建信用风险模型、评估资产池的现金流稳定性,并检验结构化金融产品的分层设计效果。这一高颗粒度的数据集,为理解汽车ABS的违约率、损失分布及提前偿付风险提供了不可多得的数据支撑。
实际应用
在实际金融市场中,该数据集的应用贯穿了ABS发行、投资与监管的全链条。对于发行机构,可通过分析历史报告期的贷款表现来优化未来的资产筛选标准,从而设计更具吸引力的证券化产品。投资机构则能利用其中的逐笔数据构建精细化的现金流分析模型,对优先级和次级证券进行差异化定价,并动态监测投资组合的信用风险敞口。此外,监管机构可借助该数据集验证ABS-EE法规的披露效果,通过跨交易比较发现潜在的系统性风险信号,进而制定更有效的资本充足率要求。该数据集已成为连接金融创新与风险管理的实用接口。
衍生相关工作
围绕该数据集,学术界与业界已衍生出一系列标志性工作。在信用风险领域,研究团队基于贷款级数据开发了针对汽车ABS的动态违约概率模型,通过融合还款历史与宏观经济指标,显著提升了损失预测的准确性。资产定价方面,学者们利用其中的提前偿付数据,构建了行为驱动的现金流折现模型,揭示了借款人信用评分与提前还款决策的深层关联。此外,数据驱动的结构化产品评价框架应运而生,通过聚类分析识别相似资产池,从而比较不同交易的收益风险特征。这些工作不仅深化了对汽车ABS市场运行规律的理解,也为后续研究提供了方法论范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作