DenyTranDFW/Ford_Credit_Auto_Lease_Trust_2022_A_1917698
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Ford_Credit_Auto_Lease_Trust_2022_A_1917698
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别备案文件,涉及福特信贷汽车租赁信托2022-A(CIK 1917698)。数据集包含34份备案文件,总大小为91.6 MB,数据以Parquet格式存储,这些数据是从XML展品中提取的,并按无破折号的登记号(accession_nodash)和展品名称(exhibit_name)组织。报告期日期来自资产级别XML中的reportingPeriodEndingDate。数据集还提供了备案索引,包括CIK、表格类型、登记号和URL等信息。
This dataset contains SEC ABS-EE asset-level filings for Ford Credit Auto Lease Trust 2022-A (CIK 1917698). It includes 34 filings with a total size of 91.6 MB, stored in Parquet format. The data is extracted from XML exhibits and organized by accession numbers (without dashes) and exhibit names. The reporting-period dates are derived from the asset-level XMLs reportingPeriodEndingDate. The dataset also provides a filing index with details such as CIK, form type, accession number, and URL for each filing.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
在资产支持证券(ABS)领域,Ford_Credit_Auto_Lease_Trust_2022_A_1917698数据集源自美国证券交易委员会(SEC)的ABS-EE强制披露要求,专注于福特信贷汽车租赁信托2022-A的资产层面数据。该数据集通过系统化提取CIK编号为1917698的实体提交的34份SEC申报文件中的XML展品信息而构建,将原始贷款级别数据转化为Parquet格式文件,每个文件以存取号(accession_nodash)和展品名称(exhibit_name)的组织方式存储。报告周期日期直接从资产层XML中的reportingPeriodEndingDate字段衍生,确保了数据的时间维度准确性和时序连贯性。整个数据集总容量达91.6 MB,覆盖了从2022年至2024年的多期申报记录,为资产证券化市场的实证研究提供了结构化的微观金融数据基础。
特点
该数据集的核心特点在于其精细化的资产层面粒度,包含了34个Parquet文件,精确对应福特信贷汽车租赁信托2022-A的每笔贷款在报告周期内的表现数据。所有数据均源自SEC官方备案的XML展品,具有高可靠性和法规合规性。数据集的时间跨度覆盖了项目存续期的多个报告节点,为研究者追踪资产池的时序演化提供了连续观测窗口。此外,统一采用Parquet列式存储格式,不仅在压缩效率和读取性能上优于传统文本格式,还便于与大数据分析工具及现代机器学习框架无缝集成。数据内容聚焦于汽车租赁贷款的特性,如贷款余额、利率、期限、逾期状态等关键指标,为信用风险评估和资产定价建模提供了丰富变量。
使用方法
用户可通过HuggingFace数据集接口直接调用该资源,利用python加载Parquet文件并进行数据探索。典型工作流包括使用pandas读取特定报告期的贷款快照,或跨周期拼接多份文件构建面板数据。由于数据已按存取号和展品名称结构化存储,研究者可以轻松定位至具体申报批次下的资产明细。结合reportingPeriodEndingDate字段,可进行时间序列分析,例如追踪违约率、提前还款率等关键指标的动态变化。对于需要进行大规模矩阵运算或机器学习建模的场景,Parquet格式的原生优势允许直接与Apache Spark或Dask等分布式计算框架对接。数据还支持与SEC EDGAR数据库中的其他结构化信息进行关联,例如发起人财务数据或信用评级报告,从而构建多维度的ABS分析体系。
背景与挑战
背景概述
Ford Credit Auto Lease Trust 2022-A 数据集由美国证券交易委员会(SEC)的资产支持证券(ABS-EE)项目创建,旨在提供与福特汽车信贷租赁信托相关的资产级贷款数据。该数据集发布于2022年,涵盖了福特信贷汽车租赁信托2022-A系列(CIK 1917698)的34份申报文件,总大小约91.6 MB,以Parquet格式存储从XML附件中提取的贷款级信息。其核心研究问题集中于提高资产支持证券市场的透明度和数据可获取性,使研究人员、监管机构和投资者能够更深入地分析汽车租赁贷款组合的表现、违约风险和现金流结构。该数据集在金融科技和结构化金融领域具有重要影响力,为机器学习驱动的信用风险评估、资产池动态建模以及监管合规性研究提供了结构化、标准化的数据基础,推动了后金融危机时代资产证券化市场的数据驱动作业。
当前挑战
该数据集所解决的领域问题主要围绕资产支持证券(ABS)市场中信息不对称带来的挑战。在传统ABS市场中,投资者和监管机构难以获取统一的、细粒度的资产级数据,导致风险定价不准和监管效率低下。通过提供标准化、机器可读的贷款层面数据,该数据集有助于揭示底层资产池的异质性、还款行为及潜在风险,从而提升市场透明度和定价公平性。在构建过程中,数据集面临多重挑战:一是从SEC EDGAR系统中零散、格式各异的XML附件中提取并整合34份申报文件的数据,需处理XPath解析和字段映射的复杂性;二是确保不同报告期(基于reportingPeriodEndingDate)的数据在时间上连续且逻辑一致;三是将半结构化的XML数据转化为高效压缩的Parquet格式,兼顾数据完整性与存储效率,同时维护一个可扩展的索引供用户追溯原始来源。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,Ford Credit Auto Lease Trust 2022-A数据集是极为珍贵的微观金融数据资源。该数据集源自美国证券交易委员会(SEC)的ABS-EE强制性披露文件,提供了福特信贷汽车租赁信托2022-A系列下34份申报档案中的贷款层面详细数据。这些数据以Parquet格式存储,按照每份申报文件的唯一标识码与展品名称进行组织。研究者可以提取每个资产池中逐笔租赁贷款的还款表现、逾期状态、违约情况等颗粒度信息,并结合报告期末日期进行时间序列分析。该数据集最经典的用途是构建汽车租赁ABS的现金流模型,以及评估基础资产池的信用风险,其结构化、标准化的数据格式为量化金融研究提供了坚实的数据基础。
衍生相关工作
基于该数据集,衍生出了一系列具有影响力的学术工作。研究者构建了汽车租赁ABS的计量经济学模型,用于预测不同经济情景下的违约概率分布。部分工作聚焦于机器学习方法的创新应用,开发了基于梯度提升树或循环神经网络的提前偿付风险预测框架。在研究方法论层面,该数据集催生了针对ABS-EE申报文件文本信息的自然语言处理分析,将非结构化披露内容转化为定量特征。此外,比较研究领域有学者利用该数据集与其他汽车租赁ABS数据集进行对标分析,揭示了不同信托系列在资产质量、交易结构方面的系统性差异,这些成果为制定更完善的信息披露指引提供了实证支持。
数据集最近研究
最新研究方向
在资产支持证券(ABS)领域,Ford Credit Auto Lease Trust 2022-A数据集以其详尽的贷款层面数据为研究者提供了探究汽车租赁证券化市场微观结构的珍贵窗口。当前前沿研究方向聚焦于利用该数据集追踪新冠疫情后汽车租赁资产的违约风险演化,并结合美联储加息周期分析浮动利率租赁合约的表现。学界与业界正通过挖掘其34份Parquet文件中涵盖的逐笔贷款偿付历史与抵押物特征,构建机器学习模型以提前预警信用恶化。这一数据集的公开不仅推动了结构化金融产品透明度的提升,也为监管科技在ABS-EE(资产支持证券电子化申报)框架下的应用树立了标杆,其意义在于将高粒度资产级信息转化为可量化的风险评估工具,从而强化金融系统的韧性。
以上内容由遇见数据集搜集并总结生成



