DenyTranDFW/Mercedes_Benz_Auto_Receivables_Trust_2022_1_1951118
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Mercedes_Benz_Auto_Receivables_Trust_2022_1_1951118
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含Mercedes-Benz Auto Receivables Trust 2022-1的SEC ABS-EE资产级别申报文件。具体包括34个申报文件、47个Parquet文件,总大小为107.8 MB,报告期从2022年10月31日至2026年2月28日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,并按{accession_nodash}/{exhibit_name}.parquet的方式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate字段。
SEC ABS-EE asset-level filings for CIK 1951118 (Mercedes-Benz Auto Receivables Trust 2022-1). The dataset includes 34 filings, 47 Parquet files, with a total size of 107.8 MB, covering the reporting period from 2022-10-31 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化提交)系统,聚焦于梅赛德斯-奔驰汽车应收款信托2022-1(CIK 1951118)。构建方式为系统化抓取并解析自2022年10月至2026年2月期间提交的34份ABS-EE申报文件中的XML附件,共计生成47个Parquet格式文件。这些文件以贷款层面或资产层面的细粒度数据为核心,依据申报编号与附件名称组织路径,每个Parquet文件对应于特定申报中的单一附件。数据集的报告期日期从资产级XML元素中提取,确保时间戳的精确性。
特点
数据集的核心特点在于其高度结构化的资产层面信息,涵盖了从2022年10月至2026年2月长达近四年的资产表现周期,总存储容量约107.8 MB。每一份申报文件均包含详尽的应收款池数据,例如贷款余额、利率、期限及还款状态等关键指标,为分析汽车贷款证券化产品的逐月动态提供了珍贵的时间序列视角。此外,数据集中包含一份修正申报,体现了SEC允许的更正机制,进一步增强了数据的准确性与完整性。
使用方法
使用该数据集时,研究人员可通过访问SEC EDGAR系统提供的原始XML链接验证数据来源,或直接加载47个Parquet文件进行批量分析。推荐采用Python的Pandas库读取Parquet格式,利用`accession_nodash/exhibit_name`结构遍历每个资产池。分析者可根据报告期日期(`reportingPeriodEndingDate`)进行时间序列排序,以追踪特定贷款池的信用表现或构建违约预测模型。数据集的开放式许可(GPL)允许学术与商业场景下的自由使用。
背景与挑战
背景概述
该数据集聚焦于梅赛德斯-奔驰汽车应收账款信托2022-1(Mercedes-Benz Auto Receivables Trust 2022-1),由美国证券交易委员会(SEC)依据ABS-EE(资产支持证券交易所法案)规则披露的资产层级申报数据整理而成。数据集创建于2022年,涵盖自2022年10月至2026年2月的申报周期,包含34份申报文件和47个Parquet格式的资产层级数据文件,总容量达107.8 MB。其核心研究问题在于为资产支持证券(ABS)领域提供细粒度的贷款层级信息,以支持对汽车应收账款证券化产品的风险定价、现金流预测及信用评估。该数据集对于研究结构化金融产品透明度、监管合规性及市场效率具有重要价值,尤其推动了基于机器学习的ABS违约预测与资产池建模等实证研究的发展。
当前挑战
该数据集所解决的领域挑战在于资产支持证券市场中资产层级数据的高维非结构化问题,传统聚合数据难以揭示单笔贷款的偿付行为与风险异质性,而ABS-EE监管要求下的XML格式数据解析与标准化成为关键障碍。构建过程中面临的挑战包括:从34份异构XML附表中提取贷款层级信息并转化为统一Parquet格式的工程设计,需处理日期字段(如reportingPeriodEndingDate)的格式不一致性;跨越近四年的申报周期内数据连续性维护,避免因申报延迟或修正文件(0000950131-25-002931与0000950131-25-002940为同日修正)导致的重复或遗漏;以及大规模数据压缩与存储优化,在107.8 MB容量内实现47个文件的快速检索与增量更新,确保金融时序分析的时效性与完整性。
常用场景
经典使用场景
Mercedes-Benz Auto Receivables Trust 2022-1 数据集专为资产支持证券(ABS)研究而构建,聚焦于汽车贷款应收款证券化领域。其经典使用场景在于,通过解析美国证券交易委员会(SEC)ABS-EE表格的XML附件,提取每笔贷款的微观特征,包括贷款本金、利率、还款期限、信用评分及逾期状态等。研究者可利用这些结构化数据,构建贷款池的信用风险模型,评估基础资产的违约概率与损失分布。该数据集覆盖从2022年10月至2026年2月的34份申报文件,时间跨度完整,为动态追踪贷款池表现、分析证券化产品生命周期提供了可靠依据。
衍生相关工作
该数据集衍生的工作主要集中于金融科技与经济学交叉领域。经典工作包括:基于机器学习梯度提升模型,预测贷款级别违约概率并对比与FICO评分的效能差异;利用自然语言处理技术解析申报文件中的条款文本,自动提取触发提前摊销的事件条件。另一研究方向是构建时间序列网络,模拟贷款池中信贷风险的传染路径,以评估单笔贷款违约对整体现金流的冲击。这些工作不仅深化了对汽车ABS风险传导机制的理解,还催生了开源金融分析工具,如自动化SEC申报数据爬取与特征工程管线,推动了资产证券化研究的可复现性。
数据集最近研究
最新研究方向
在全球资产证券化(ABS)领域,数据驱动的结构化金融产品分析正成为前沿热点,尤其是对汽车贷款支持证券(Auto ABS)底层资产表现的研究。梅赛德斯-奔驰汽车应收账款信托2022-1数据集收录了自2022年10月至2026年2月间累计34份SEC ABS-EE申报文件,涵盖47个Parquet格式的逐笔贷款级资产数据,总容量达107.8 MB。该数据集的高频报送周期(月频)与持久时间跨度(横跨三年半),为深入剖析优质汽车贷款组合的信用行为、提前还款动态及违约演化轨迹提供了稀缺的微观实证基础。在监管透明度提升与金融科技深度渗透的背景下,这一数据资源有助于学者与从业者构建基于机器学习的资产池风险定价模型,验证宏观经济冲击下资产表现的韧性,并推动ABS市场定价效率与投资者保护的范式革新。
以上内容由遇见数据集搜集并总结生成



