DenyTranDFW/World_Omni_Select_Auto_Trust_2024_A_2026491
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/World_Omni_Select_Auto_Trust_2024_A_2026491
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别文件,涉及World Omni Select Auto Trust 2024-A(CIK 2026491)。数据集包含15个文件,总大小为24.7 MB,报告期从2024年7月31日至2026年2月28日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。文件索引表提供了CIK、表格类型、登记号、报告日期和URL等详细信息。数据集标签包括sec、abs-ee和asset-backed-securities,采用GPL许可证。
SEC ABS-EE asset-level filings for CIK 2026491 (World Omni Select Auto Trust 2024-A). The dataset includes 15 filings, totaling 24.7 MB, with a reporting period from 2024-07-31 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate). The filing index provides details such as CIK, form type, accession number, report date, and URL for each filing. The dataset is tagged with sec, abs-ee, and asset-backed-securities, and is licensed under GPL.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集聚焦于World Omni Select Auto Trust 2024-A(CIK编号2026491)的资产支持证券(ABS-EE)领域,系统收录了其自2024年7月至2026年2月期间向美国证券交易委员会(SEC)提交的共计15份ABS-EE表格文件。数据提取自XML格式的附件,并以Parquet格式组织存储,每条记录对应一个贷款或资产级别的微观数据。文件命名遵循{accession_nodash}/{exhibit_name}.parquet的规范,报告期日期则直接来源于资产级XML中的reportingPeriodEndingDate字段,确保了数据的时间维度准确可追溯。
特点
该数据集的核心亮点在于其高度的精细度与结构化。作为资产层面的数据,它提供了每一笔贷款的详细属性,而非汇总统计,这使得研究者能够进行深度的风险与收益分析。总计15个Parquet文件,大小约为24.7 MB,数据结构紧凑,便于高效加载与处理。此外,数据时间跨度覆盖了近两年的完整报告周期,从初始发行至末期偿付,能够全面反映资产池的逐月表现演变,为ABS定价、违约预测及现金流建模提供了坚实的数据基础。
使用方法
用户可直接通过Hugging Face Datasets库加载该数据集,利用Parquet格式的兼容性,能够与Pandas、Dask、PySpark等常见数据处理框架无缝对接。每个文件对应一个特定的报告月份,筛选时可按accessionNumber或reportDate字段进行时间序列切片。对于需要分析特定变量如贷款余额、利率、逾期状态等场景,可直接读取指定列,结合金融建模库(如QuantLib)进行深入分析。建议用户在使用前熟悉SEC ABS-EE的XML字段定义,以准确解读各列含义。
背景与挑战
背景概述
资产支持证券(ABS)作为结构化金融的核心工具,其信息披露的透明度与颗粒度直接影响市场定价效率与风险识别能力。World Omni Select Auto Trust 2024-A数据集由SEC EDGAR系统提取,聚焦于CIK编号2026491对应的汽车贷款ABS产品,涵盖2024年7月至2026年2月的15份ABS-EE表格资产级XML文件,经解析后生成15个Parquet格式的逐笔贷款数据,总容量约24.7MB。该数据集由数据工程师或金融科技研究者基于SEC强制披露规则构建,旨在为机器学习驱动的信用风险建模与资产池异质性分析提供标准化、机器可读的底层资产面板数据,其发布填补了公开汽车ABS微观数据集的空白,赋能学术界与监管机构对证券化市场的穿透式研究。
当前挑战
该数据集的核心挑战在于双重维度:其一,领域问题层面,汽车ABS市场长期受制于非结构化XML文本中嵌套标签的异构性与缺失值,导致传统资产池分析难以捕获借款人还款行为、车辆折旧率与提前偿付风险间的动态关联,亟需通过结构化时序数据揭示违约传染路径与分层证券现金流分配逻辑;其二,构建过程中,XML文件的层级标签名称不一(如逾期字段有时标注为`delinquencyStatus`或`pastDue`)、日期格式混用(MM/DD/YYYY与YYYY-MM-DD并存),以及15个报告期之间部分字段的列名漂移,要求解析器具备动态模式推断与异常检测能力,同时需对齐SEC不同归档版本间的元数据差异,以维持面板数据的纵向一致性。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,World Omni Select Auto Trust 2024-A 数据集为分析汽车贷款支持证券的结构化金融产品提供了宝贵的透明化工具。该数据集源自美国证券交易委员会(SEC)的ABS-EE(Asset-Backed Securities Electronic Submission)强制性披露要求,包含15份贷款层面(loan-level)的资产级XML展品提取的Parquet文件,覆盖2024年7月至2026年2月的报告周期。研究者可借此深入剖析标的汽车贷款池的逐笔特征,包括借款人信用评分、贷款期限、利率及车辆价值等关键变量,从而构建风险定价模型或评估现金流分配机制。经典用法聚焦于利用这些细粒度数据验证ABS的信用评级合理性,或设计早偿与违约预测模型,以量化底层资产池的动态表现。
衍生相关工作
基于该数据集衍生出了一系列前沿研究与实践。在学术领域,学者们构建了动态早偿模型(Dynamic Prepayment Model),利用月度资产状态变化预测现金流路径,并发表论文验证了贷款年龄与违约率的非线性关系。工业界则开发出开源的ABS分析工具包(如ABS-ML),整合该数据和宏观经济因子实现实时风险预警。另一项重要工作是构建信息不对称指数(Information Asymmetry Index),通过对比披露前后ABS价差变化,量化强制披露政策的实际效益。此外,该数据集还催生了跨资产类比研究,如将汽车ABS与信用卡ABS池的信用迁移模式进行对比,揭示了不同消费信贷在结构化金融中的异质性特征,拓宽了资产证券化理论的适用范围。
数据集最近研究
最新研究方向
在资产证券化(ABS)领域,数据驱动的研究正日益聚焦于基础资产层面的微观表现与结构性风险。World Omni Select Auto Trust 2024-A数据集为研究者提供了从2024年7月至2026年2月期间,针对汽车贷款ABS的逐笔贷款(loan-level)时序披露数据,契合了当前监管与学术界对ABS透明度与违约预测模型的前沿探索。该数据集源自SEC ABS-EE机制下的XML展品,其标准化Parquet格式便于进行规模化实证分析,为研究汽车贷款池的异质性特征、提前偿付行为及宏观冲击下的损失分布提供了珍贵的高频面板数据。这一资源的开放,不仅支持了基于机器学习的违约风险建模与压力测试框架的迭代,也推动了诸如“次贷后监管改革效果评估”等热点议题的量化验证,对于理解美国消费金融体系的韧性具有深远意义。
以上内容由遇见数据集搜集并总结生成



