DenyTranDFW/World_Omni_Auto_Receivables_Trust_2022_B_1926999
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/World_Omni_Auto_Receivables_Trust_2022_B_1926999
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含SEC ABS-EE资产级别的文件,具体为World Omni Auto Receivables Trust 2022-B(CIK 1926999)的相关文件。数据集包含33个文件,格式为Parquet,总大小为90.2 MB,报告期从2022年4月30日至2026年2月28日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按照{accession_nodash}/{exhibit_name}.parquet的方式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate。
SEC ABS-EE asset-level filings for CIK 1926999 (World Omni Auto Receivables Trust 2022-B). The dataset includes 33 filings, in Parquet format, with a total size of 90.2 MB, covering the reporting period from 2022-04-30 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(Asset-Backed Securities Exchange Electronic)申报系统,聚焦于World Omni Auto Receivables Trust 2022-B的资产层面数据。数据通过提取XML展品中的贷款级/资产级信息构建,并以Parquet格式存储,每个文件按`{accession_nodash}/{exhibit_name}.parquet`的命名规则组织。报告期日期来源于资产级XML中的`reportingPeriodEndingDate`字段,共计33份申报文件,数据规模为90.2 MB,覆盖从2022年4月30日至2026年2月28日的完整报告周期。
特点
作为资产支持证券领域的专业性数据集,其核心特色在于提供了细粒度的资产层面信息,便于对汽车贷款应收款池进行深度剖析。数据以Parquet列式存储格式呈现,具备高效的压缩性能与查询速度,适合大规模金融数据分析。此外,数据集的报告周期跨度近四年,能够支持时序性的风险建模与现金流预测研究,且所有文件均源自SEC官方备案,确保了信息的权威性与合规性。
使用方法
用户可直接通过HuggingFace平台下载Parquet文件,利用Pandas、Dask等数据处理库加载数据至本地环境。数据集中提供了申报索引表,包含CIK编号、表格类型、受理号及报告日期等元信息,便于用户按需筛选特定时间段或申报文件进行分析。对于研究汽车贷款ABS产品表现的学者或投资者,可结合资产级别的逐笔贷款数据进行违约率、提前偿付率等指标的量化评估,或用于构建机器学习预测模型。
背景与挑战
背景概述
在资产证券化(ABS)领域,透明、标准化的资产级数据是投资者进行风险定价与监管机构实施有效监督的基石。World Omni Auto Receivables Trust 2022-B数据集由美国证券交易委员会(SEC)依据ABS-EE规则强制披露,涵盖了自2022年4月至2026年2月间33份月度资产级申报文件,数据量达90.2 MB,均提取自XML附录并转化为便于分析的Parquet格式。该数据集聚焦于汽车贷款应收款这一基础资产类型,为研究汽车ABS的信用表现、提前偿付行为及证券化结构设计提供了罕见的细颗粒度公开资源,推动了金融科技与计量经济学领域对资产池动态的实证分析。
当前挑战
该数据集所应对的领域核心挑战在于,传统ABS信息披露往往局限于汇总层面的静态数据,难以揭示资产池内贷款的异质性风险,而该数据集通过提供每笔贷款的逐月表现记录(如还款状态、剩余本金等),使投资者能够构建更精准的违约与损失模型。构建过程中,挑战主要源于SEC ABS-EE XML结构的复杂性,不同申报期与发行人可能采用差异化的标签体系,导致数据提取与标准化时需要处理字段映射与缺失值填补;此外,确保跨时间序列的数据一致性与校验资产级指标的完整性,也对数据处理流程提出了高度要求。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,World Omni Auto Receivables Trust 2022-B 数据集作为SEC ABS-EE监管框架下的标准资产级披露范例,为分析汽车贷款证券化产品的底层资产池特征提供了详实的数据基础。研究者可通过该数据集中的贷款级Parquet文件,深入剖析每笔贷款的原始余额、利率、期限、地域分布及借款人信用评分等核心指标,进而系统评估资产池的异质性结构与信用增级机制。这一数据集特别适用于构建资产池现金流模型和模拟不同经济情景下的违约损失分布。
实际应用
在实务操作中,投资机构利用该数据集中的月度资产表现数据,构建动态提前偿付率(CPR)与违约率(CDR)监测体系,实时追踪World Omni Auto Receivables Trust 2022-B的信用风险敞口。监管机构可依托该数据开展压力测试,校准汽车贷款风险权重参数。信用评级机构将其作为基准数据库,优化对同类交易信用增级充分性的评估模型。
衍生相关工作
围绕该数据集衍生出一系列经典研究,包括基于机器学习方法构建贷款层面违约预测模型(如XGBoost与随机森林的对比分析),以及利用潜在狄利克雷分配(LDA)主题模型从资产池文本描述中提取违约驱动因子。此外,该数据催生了关于通胀环境对可调整利率汽车贷款表现影响的因果推断研究,以及将图神经网络应用于资产池关联性分析的创新工作。
以上内容由遇见数据集搜集并总结生成



