DenyTranDFW/World_Omni_Auto_Receivables_Trust_2022_A_1905216
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/World_Omni_Auto_Receivables_Trust_2022_A_1905216
下载链接
链接失效反馈官方服务:
资源简介:
SEC ABS-EE资产级别文件,涉及CIK 1905216(World Omni Auto Receivables Trust 2022-A)的相关数据。包含36个文件,格式为Parquet,总大小为83.4 MB,报告期从2021-12-31至2026-02-28。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,组织为`{accession_nodash}/{exhibit_name}.parquet`格式。报告期日期来源于资产级别XML的`reportingPeriodEndingDate`字段。
SEC ABS-EE asset-level filings for CIK 1905216 (World Omni Auto Receivables Trust 2022-A). Includes 36 filings in Parquet format, totaling 83.4 MB, with a reporting period from 2021-12-31 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as `{accession_nodash}/{exhibit_name}.parquet`. Reporting-period dates are derived from the asset-level XML (`reportingPeriodEndingDate`).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集聚焦于美国证券交易委员会(SEC)已备案的资产支持证券(ABS-EE)领域,针对World Omni Auto Receivables Trust 2022-A(CIK: 1905216)这一特定资产池构建。数据源自SEC EDGAR系统中提交的XML展品文件,提取其中的贷款级或资产级数据,并转换为Parquet格式存储。每个Parquet文件按照{accession_nodash}/{exhibit_name}.parquet的层级结构组织,确保数据来源的可追溯性。报告周期从2021年12月31日延伸至2026年2月28日,覆盖共计36份备案文件,总体积达83.4 MB,为研究者提供了丰富的时间序列样本。
特点
数据集的核心特点在于其精细的资产级粒度与标准化存储格式。通过从XML展品中提取并整理,每份文件均独立对应一次ABS-EE备案,包含具体资产的逐笔明细信息。报告结束日期嵌入在原始XML元数据中,便于时间维度的聚类分析。数据以Parquet格式交付,支持高效压缩与列式读取,极大优化了大规模金融数据的存储与检索效率。此外,数据集保留了SEC备案独有的结构化索引,包括CIK编号、表格类型、接入号及对应URL,使用户能够迅速关联原始监管文件。
使用方法
研究者可通过直接读取Parquet文件的方式访问资产级数据,无需繁琐的XML解析过程。每个Parquet文件均可通过Python的Pandas或PySpark库快速加载,并结合报告周期内的字段进行时间序列分析。数据集附带的备案索引表格提供了完整的元数据概览,用户可按cik、form或reportDate筛选特定时间段的文件。利用接入号对应的SEC官方链接,还可进一步验证或补充原始披露信息。该数据集尤其适用于资产支持证券的信用风险建模、违约率预测及ABS市场流动性研究等深度学习或统计推断任务。
背景与挑战
背景概述
World Omni Auto Receivables Trust 2022-A 数据集由美国证券交易委员会(SEC)依据ABS-EE(Asset-Backed Securities-Exhibit Exchange)规定创建,旨在提供资产支持证券(ABS)领域的逐笔贷款级数据。该数据集覆盖从2021年12月31日至2026年2月28日的36份监管申报文件,总量达83.4 MB,来自CIK编号1905216的发行人World Omni Auto Receivables Trust 2022-A。其核心研究问题聚焦于汽车贷款资产池的信用风险建模、现金流预测及证券化产品的透明度提升。通过提供结构化Parquet格式的资产级数据,该数据集为金融科技、监管科技及量化研究领域开辟了新的数据基础,尤其推动了基于机器学习的ABS违约预测和评级分析模型的发展,对促进次级汽车贷款市场的标准化和可解释性具有里程碑意义。
当前挑战
该数据集所解决的领域挑战在于,传统ABS市场信息披露碎片化、非结构化,导致投资者难以进行逐笔资产的风险定价。例如,汽车贷款资产池的早偿率、违约率与回收率等关键指标常因数据缺失而难以建模。在数据构建过程中,核心挑战源自从SEC EDGAR系统的XML附件中批量提取嵌套标签,需处理不同报告期内数据模式的不一致性。此外,包含36个Parquet文件、跨度五年的数据时效性与完整性验证构成难题,尤其是部分缺失字段的填充策略需兼顾统计合理性。数据格式的标准化转换、大规模时间序列的清洗,以及与外部信用评级模型的兼容性,进一步加剧了工程实现的复杂性。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,World Omni Auto Receivables Trust 2022-A 数据集为学者提供了一份宝贵的微观金融数据宝库。该数据集收录了自2021年12月至2026年2月期间,基础资产池中每笔汽车贷款的逐笔明细,涵盖回款表现、逾期状态及偿付结构等关键特征。研究者可借此构建贷款级违约预测模型,或剖析资产池的现金流动态与信用增级机制,从而深入理解汽车贷款证券化产品的风险定价与结构化设计逻辑。
衍生相关工作
该数据集衍生了一系列前沿工作,包括构建基于贷款级特征的违约风险早偿模型、开发解释性强的图神经网络用于资产池表现预测,以及设计针对ABS-EE申报格式的自动化信息提取与合规分析工具。相关研究还催生了融合时间序列分析与自然语言处理的混合框架,用于挖掘监管文本与资产数据间的关联,并为SEC新规下的资产级信息披露标准提供了实证评估与改进建议。
数据集最近研究
最新研究方向
基于SEC ABS-EE标准化报送框架,World Omni Auto Receivables Trust 2022-A数据集的发布为资产支持证券(ABS)领域的微观层面实证研究提供了高颗粒度的逐笔贷款级数据源泉。近期前沿研究方向聚焦于利用大规模结构化XML解析所生的Parquet文件,结合长达逾四年的报告周期(2021年末至2026年初),构建动态违约预测模型与现金流传导机制分析。特别是在汽车金融信贷资产持续扩张与宏观经济波动共振的背景下,该数据集能支撑研究者深入剖析个人汽车贷款的偿债行为演化、提前偿付率变化对结构化产品分层的冲击,以及信用增级措施的失效阈值。其与SEC监管透明度提升、资产证券化信息披露强化等热点事件紧密相连,为量化评估资产池异质性风险、优化ABS定价模型提供了坚实的数据基石,对推动金融科技在结构化金融领域的合规创新具有里程碑式意义。
以上内容由遇见数据集搜集并总结生成



