DenyTranDFW/World_Omni_Auto_Receivables_Trust_2021_D_1885500
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/World_Omni_Auto_Receivables_Trust_2021_D_1885500
下载链接
链接失效反馈官方服务:
资源简介:
数据集World Omni Auto Receivables Trust 2021-D包含CIK 1885500(World Omni Auto Receivables Trust 2021-D)的SEC ABS-EE资产级别备案文件。数据集包含42个备案文件,每个文件都转换为Parquet格式,总大小为106.0 MB。报告期从2021-09-30到2025-08-31。Parquet文件按accession number和exhibit名称组织,报告期日期从资产级别XML中提取。备案索引提供了每个备案的详细信息,包括CIK、表格类型、accession number、报告日期和URL。
The dataset World Omni Auto Receivables Trust 2021-D contains SEC ABS-EE asset-level filings for CIK 1885500 (World Omni Auto Receivables Trust 2021-D). The dataset includes 42 filings, each converted into Parquet files, totaling 106.0 MB in size. The reporting period spans from 2021-09-30 to 2025-08-31. The Parquet files are organized by accession number and exhibit name, and the reporting period dates are derived from the asset-level XML. The filing index provides detailed information about each filing, including CIK, form type, accession number, report date, and URL.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
World Omni Auto Receivables Trust 2021-D 数据集基于美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化存管)制度构建,旨在为市场参与者提供透明、标准化的资产层面数据。该数据集聚焦于CIK编号1885500所对应的信托实体,通过系统性地采集其自2021年9月30日至2025年8月31日期间提交的全部42份ABS-EE申报文件,并从中提取XML格式的贷款层级电子展品,最终将非结构化数据转化为高度结构化的Parquet文件。每个Parquet文件的命名遵循‘{accession_nodash}/{exhibit_name}.parquet’的范式,确保数据来源可追溯至具体的申报受理号,同时通过解析XML中的‘reportingPeriodEndingDate’字段精确标注每份数据的报告周期截止日期,从而构建起一个时序完整、颗粒细腻的资产池信息库。
特点
该数据集最显著的特征在于其细粒度的资产层面信息覆盖,它并非笼统的信托汇总数据,而是逐笔贷款级别的明细记录,能够深度揭示底层资产的信用表现与现金流特征。数据的时间跨度长达近四年,覆盖了从证券发行初期至后续48个月报告期的完整生命周期,为分析资产池的长期表现与违约趋势提供了连续的时间序列。此外,数据集严格遵循SEC监管标准,所有信息均来源于官方申报,确保了数据的高权威性与法律合规性。42份Parquet文件总计约106.0 MB的规模,在保障信息丰富度的同时维持了良好的数据可管理性,便于研究人员进行大范围统计分析。
使用方法
该数据集的使用路径清晰且高效,用户可直接通过加载Parquet文件进入分析流程。每个文件代表特定申报受理号下的单一展品内容,借助Python的Pandas或DuckDB等数据处理工具,可以轻松实现数据的读取、清洗与聚合。由于文件名已内嵌申报受理号与展品名称标识,结合README文件提供的申报索引表格(包含CIK、表单类型、受理日期及SEC官网链接),用户可精确回溯每份数据的原始申报上下文。建议研究者在分析资产池表现时,依据‘reportingPeriodEndingDate’字段对多期数据进行纵向拼接,以构建动态的面板数据集,从而开展逾期率、提前还款率及损失曲线等关键指标的深入建模与评估工作。
背景与挑战
背景概述
World Omni Auto Receivables Trust 2021-D 数据集由美国证券交易委员会(SEC)依据ABS-EE监管要求整理发布,聚焦于资产支持证券(ABS)领域中汽车贷款池的微观层面信息披露。自2021年9月30日首次报送至2025年8月31日,该数据集收录了42份Parquet格式的资产级XML文档,覆盖CIK为1885500的World Omni Auto Receivables Trust 2021-D的完整存续期。作为结构化金融研究的重要资源,该数据集为分析汽车ABS的资产表现、违约风险及现金流分布提供了精细化的逐笔贷款数据,推动了资产证券化市场透明度与机器学习模型在信用风险评估中的交叉应用。
当前挑战
该数据集所解决的领域核心挑战在于汽车ABS市场中资产级数据的高度非标准化与不透明性,传统研究方法受限于汇总统计指标,难以捕捉贷款池内的异质性风险。具体挑战包括:1)从SEC EDGAR系统中提取的XML文件包含复杂嵌套结构,需通过自然语言处理与XML解析技术实现数据的结构化清洗;2)42份文件对应从发行至清偿的全周期,时间跨度内可能存在贷款状态更新不一致或缺失值问题,需设计鲁棒的插补与对齐策略;3)数据集虽提供资产级粒度,但缺乏借款人信用评分等敏感字段,迫使研究者依赖代理变量(如还款历史、地域分布)构建预测模型,增加了模型泛化的难度。
常用场景
经典使用场景
在资产支持证券(ABS)的学术与实务研究中,World Omni Auto Receivables Trust 2021-D 数据集以其详尽的逐笔贷款层面数据,成为剖析汽车贷款证券化结构的经典范本。研究者通常利用该数据集中涵盖的每笔应收账款的还款历史、逾期状态、剩余本金及合约条款等信息,构建资产池现金流预测模型,评估信用风险分层与期限结构。其跨越近四年的月度报告周期,为动态分析贷款组合的提前偿付率、违约率以及回收率提供了连续时间序列,从而支持对结构化产品收益与风险特性的深入解构。
衍生相关工作
基于该数据集,学术界与业界已衍生出多项具有影响力的后续工作:例如,有学者利用其资产级数据构建了可解释的信用风险早期预警框架,通过集成梯度提升树与特征重要性归因,显著提升了违约前6个月的识别准确率。另有一项经典研究以此为基础,模拟了不同利率情景下前偿行为对次级债券分层收益的非线性冲击,该成果已被纳入多篇结构金融手册的参考案例。此外,以该数据集为训练集的开源现金流模拟器,已成为众多金融科技平台测算ABS产品久期与凸性的默认工具之一。
数据集最近研究
最新研究方向
在资产支持证券(ABS)领域,World Omni Auto Receivables Trust 2021-D数据集为汽车贷款证券化市场的微观结构分析提供了珍贵的底层资产级数据。当前研究前沿聚焦于利用该数据集中的逐笔贷款信息,结合机器学习方法预测提前还款与违约风险,尤其在美联储加息周期后,消费者信贷行为变化成为热点。该数据涵盖2021年至2025年的完整报告期,使得研究者能够系统追踪新冠疫情后经济复苏期间汽车贷款池的表现,并评估信用风险迁移路径。其重要性在于,通过对SEC要求的ABS-EE XML展品进行结构化转换,该数据集打通了监管披露与量化金融分析之间的壁垒,为会计、金融工程与风险管理领域的交叉研究提供了可复现的标准化数据基础。
以上内容由遇见数据集搜集并总结生成



