five

DenyTranDFW/World_Omni_Auto_Receivables_Trust_2025_C_2074794

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/World_Omni_Auto_Receivables_Trust_2025_C_2074794
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含SEC ABS-EE资产级别的文件,具体针对World Omni Auto Receivables Trust 2025-C(CIK 2074794)。数据集包含5个Parquet文件,总大小为13.0 MB,报告期从2025年6月30日至2026年2月28日。这些文件是从XML展品中提取的贷款级别/资产级别数据,并按{accession_nodash}/{exhibit_name}.parquet的格式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate字段。

SEC ABS-EE asset-level filings for CIK 2074794 (World Omni Auto Receivables Trust 2025-C). The dataset includes 5 filings, 5 Parquet files, with a total size of 13.0 MB. The reporting period starts from 2025-06-30 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券交易所电子化)申报体系,聚焦于World Omni Auto Receivables Trust 2025-C这一特定信托实体(CIK编号2074794)。数据集通过系统化爬取SEC EDGAR数据库中的XML附件,提取了5份ABS-EE申报文件中的贷款级资产明细数据,并统一转化为Parquet列式存储格式。每份文件按申报接入号与附件的组合方式进行命名和组织,数据结构严格遵循XML中定义的字段标准,并依据`reportingPeriodEndingDate`字段标注报告期日期,从而形成一套结构化、可机器读取的资产级信息库。
特点
该数据集的核心特点在于其专注于汽车应收账款证券化领域的高频细粒度数据。包含从2025年6月至2026年2月共5个报告时点的资产级时序信息,总容量达13.0 MB,涵盖了贷款余额、还款状态、借款人信用特征等微观指标。数据以Parquet格式存储,兼具高压缩比与快速列式查询优势,适用于大规模金融数据分析。此外,每个申报文件均附带SEC链接与报告日期索引,便于用户溯源验证,体现了金融监管数据公开透明与学术研究可复现性的双重价值。
使用方法
用户可通过Hugging Face Datasets库直接加载该数据集的Parquet文件,利用Python环境进行解压与分析。典型的使用流程包括:使用`datasets.load_dataset`函数读取数据,结合Pandas或Dask等工具进行数据清洗、特征工程与时间序列建模。研究场景可涵盖汽车贷款违约预测、资产池现金流建模、ABS定价与风险测度等方向。由于数据源遵循GPL许可证,用户应确保符合开源代码的使用规范,并在发表成果时注明数据出处及SEC EDGAR的原始链接。
背景与挑战
背景概述
在资产证券化(ABS)领域,细致入微的资产层面数据是评估信用风险与市场透明度的基石,而美国证券交易委员会(SEC)推行的ABS-EE(Asset-Level Electronic)申报制度,正为这一需求提供了规范化的数据来源。World Omni Auto Receivables Trust 2025-C数据集正是基于此背景于2025年创建,由SEC监管机构主导,聚焦于汽车贷款应收账款证券化产品,旨在捕捉底层资产池的逐笔贷款表现。该数据集核心研究问题在于如何通过高颗粒度、时序化的资产级信息,揭示汽车ABS产品的违约模式、提前还款行为及现金流分布,从而增强市场参与者对结构化产品的定价与风险管理能力。其对相关领域的影响力体现在:为金融科技、计算经济学及监管科技研究提供了标准化、可机器处理的实证样本,推动了ABS市场从粗放式披露向精细化数据分析的范式转移。
当前挑战
本数据集所解决的核心领域挑战是资产证券化市场中普遍存在的信息不对称问题,具体表现为传统summary-level披露框架无法满足投资者对底层资产异质性风险的识别需求,导致定价偏差与系统性风险累积。在构建过程中,数据集须克服多重技术障碍:其一,从SEC EDGAR系统爬取的XML附件格式不一、命名规范松散,需设计高鲁棒性的解析器以统一提取loan-level字段;其二,报告期跨越2025年6月至2026年2月,时序数据易存在空缺或迟延报送,需建立一致的匹配与补全逻辑;其三,汽车贷款资产涉及借款人隐私信息脱敏,需在保留统计属性前提下剔除可识别个人身份的数据点,平衡透明度与合规性。
常用场景
经典使用场景
World Omni Auto Receivables Trust 2025-C数据集作为资产支持证券(ABS)领域的标准化数据源,经典使用场景聚焦于基于资产层面信息的证券化产品分析与建模。研究者通过解析该数据集提供的贷款级Parquet文件,能够深入追踪每笔汽车贷款的偿付轨迹、信用表现及资产池的动态演化,从而构建精准的现金流预测模型与风险定价框架。该数据集以SEC ABS-EE格式呈现,其高颗粒度的资产明细与规范的报告周期,为进行资产池多样化分析、提前偿付行为建模及违约率测算提供了可靠的数据基础。
衍生相关工作
该数据集衍生了若干富有影响力的研究工作,集中体现于基于资产级数据的ABS定价模型改进与风险预测算法创新。例如,学者们将其应用于训练机器学习和深度学习模型,预测贷款个体违约概率及资产池损失分布,显著提升了传统统计模型的精度。此外,该数据集激发了关于结构化金融产品信息披露质量的研究,催生了量化披露透明度指标与市场反应之间关系的实证分析。这些衍生工作不仅丰富了结构化金融领域的理论体系,也为后续数据驱动的ABS研究奠定了方法论基础。
数据集最近研究
最新研究方向
该数据集聚焦于资产支持证券(ABS)领域,特别是汽车贷款应收款项证券化产品(World Omni Auto Receivables Trust 2025-C),其前沿研究方向在于利用SEC ABS-EE备案中的逐笔贷款级数据,结合大数据与机器学习方法,对证券化资产池的信用风险进行动态监测与违约预测。近期热点事件包括美国证券交易委员会(SEC)强化ABS信息披露要求的背景下,此类数据集为投资者与监管机构提供了前所未有的粒度,支持从底层资产现金流表现到结构化产品定价的全链条分析。其影响在于推动ABS市场透明度提升,促进更精准的评级模型构建,并为金融科技驱动的风险管理创新提供实证基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作