five

DenyTranDFW/Exeter_Automobile_Receivables_Trust_2024_5_2035303

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Exeter_Automobile_Receivables_Trust_2024_5_2035303
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别文件,涉及CIK 2035303(Exeter Automobile Receivables Trust 2024-5)。数据集包括19个文件,总大小为55.7 MB,报告期从2024年8月31日至2026年2月28日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate。

SEC ABS-EE asset-level filings for CIK 2035303 (Exeter Automobile Receivables Trust 2024-5). The dataset includes 19 filings, totaling 55.7 MB, with a reporting period from 2024-08-31 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
Exeter Automobile Receivables Trust 2024-5 数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)体系,聚焦于Exeter汽车应收账款信托2024-5系列(CIK编号2035303)的资产层面公开披露信息。该数据集通过系统化爬取SEC Edgar数据库中XML格式的原始申报文件构建而成,共收录19份月度申报文件,时间跨度从2024年8月至2026年2月。每份申报文件被解析为Parquet文件,以`{accession_nodash}/{exhibit_name}.parquet`的目录结构组织,其中`reportingPeriodEndingDate`字段直接提取自XML元数据,确保了时间标签的精确性。所有文件大小为55.7 MB,呈现为高性能列式存储格式,便于后续分析处理。
特点
该数据集的核心特点在于其高度的结构化和完整性,覆盖了Exeter汽车应收账款信托在19个月内的逐笔贷款或资产级数据。作为SEC强制披露的ABS-EE申报数据,其字段内涵盖了从基础贷款特征到还款表现的多维信息,为资产支持证券的风险建模、违约预测和现金流分析提供了精细化的底层数据支持。数据以Parquet格式存储,兼具压缩效率与查询速度,尤其适合大规模金融数据的分布式处理。此外,每个文件与SEC官方存档严格对应,确保可追溯性和审计合规性,对于量化研究者和监管科技应用而言具有不可替代的价值。
使用方法
用户可通过Hugging Face Datasets库直接加载此数据集,利用Python环境实现快速访问。基本使用方法为`load_dataset('Exeter_Automobile_Receivables_Trust_2024_5_2035303')`,加载后数据集将自动按申报月份分区,每个分区对应一个Parquet文件。分析者可根据`reportDate`字段筛选特定时间窗口的资产快照,或合并全部文件以构建完整的贷款池面板数据。结合Pandas或Dask等数据处理框架,可进行贷款级别的时间序列分析、资产池集中度评估或偿付能力测试。对于需要对接SEC原始申报的用户,数据集内嵌的`url`字段可直接导向官方存档,便于交叉验证。
背景与挑战
背景概述
Exeter Automobile Receivables Trust 2024-5数据集由美国证券交易委员会(SEC)基于ABS-EE(Asset-Backed Securities-Exhibits and Events)法规披露要求创建,聚焦于汽车贷款债权证券化产品的资产层面数据。该数据集对应CIK代码2035303,涵盖2024年8月至2026年2月期间19份XML展示文件的Parquet格式转化,总容量55.7 MB。其核心研究问题在于为金融监管合规、信用风险评估及资产池质量分析提供标准化、机器可读的微观数据,推动结构化金融领域的透明化研究。作为公开的资产支持证券微观数据集,它弥补了以往ABS领域缺乏精细贷款级数据的缺憾,对风险管理、投资决策及监管科技演进具有重要支撑价值。
当前挑战
该数据集首要应对资产支持证券市场长期面临的透明度不足问题——传统ABS报告仅为摘要级,无法支持贷款级违约相关性与现金流异质性分析;Exeter_2024-5通过披露逐笔贷款的还款状态与表现特征,为建模借款人偿付行为、评估分层利息偿付顺序开辟了新路径。在构建层面,原始SEC XML文档因结构复杂、标签不一致,需通过自动化解析与标准化清洗转化为统一Parquet格式;其中reportingPeriodEndingDate字段的提取虽已实现,但不同时间窗口间数据格式变动及缺失值的处理仍构成技术瓶颈。此外,将美式金融术语与合规字段映射至国际通用分析框架的转换过程,也对数据质量保障提出了更高要求。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,Exeter Automobile Receivables Trust 2024-5数据集提供了详尽且标准化的逐笔贷款层面信息,涵盖从2024年8月至2026年2月的19个报告期。研究者可借此深入剖析汽车贷款ABS的基础资产池特征,包括贷款规模、利率、期限、地域分布、借款人信用评分及还款历史等关键维度。该数据集的经典应用在于构建抵押贷款组合的信用风险模型,通过追踪资产池的月度表现,能够精准刻画贷款违约、提前偿付及损失分布等动态演变规律,为评估证券化产品的现金流结构与风险定价提供了坚实的数据基石。
实际应用
在实际应用层面,该数据集为金融机构、风险管理部门与信用评级机构提供了高信度的资产池履约追踪基准。投资经理可通过分析贷款还款曲线与损失率,优化其ABS投资组合的久期管理与信用增级策略;评级机构能够基于历史数据校准违约概率与回收率模型,从而对同类汽车贷款证券化产品做出更审慎的信用评级。此外,该数据还支撑了监管科技(RegTech)解决方案的落地,助力市场参与者自动监测底层资产的实时健康状况,早期预警信用恶化信号,有效提升了证券化市场的运营效率与风控水平。
衍生相关工作
该数据集的推出催生了多项具有重要影响力的衍生研究工作。例如,学者利用贷款级面板数据,开发了基于机器学习的提前偿付与违约联合预测模型,显著提升了传统生存分析模型的预测精度。另一经典方向是构建ABS分层债券的现金流模拟框架,将实际资产池的逐月表现与交易结构中的优先劣后档偿付机制结合,探讨分级证券的风险隔离效果。此外,研究者还依托该数据揭示了贷款利率市场化背景下,发起人贷款发放标准与证券化后道德风险行为之间的动态关联,为学术界与业界在结构化金融产品创新与风险监管之间取得平衡提供了宝贵的实证依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作