five

DenyTranDFW/Harley_Davidson_Motorcycle_Trust_2024_B_2034427

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Harley_Davidson_Motorcycle_Trust_2024_B_2034427
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别备案文件,涉及Harley-Davidson Motorcycle Trust 2024-B(CIK 2034427)。数据集包含19个备案文件,总大小为37.2 MB,报告期为2024年8月31日至2026年2月28日。数据以Parquet文件格式存储,这些文件是从XML展品中提取的贷款级别/资产级别数据。README还提供了备案索引,包括CIK、表格类型、登记号、报告日期和每个备案的URL。数据集标签包括sec、abs-ee和asset-backed-securities,并采用GPL许可证。

This dataset contains SEC ABS-EE asset-level filings for Harley-Davidson Motorcycle Trust 2024-B (CIK 2034427). It includes 19 filings with a total size of 37.2 MB, covering the reporting period from 2024-08-31 to 2026-02-28. The data is stored in Parquet files, which are loan-level/asset-level data extracted from XML exhibits. The README also provides a filing index with details such as CIK, form type, accession number, report date, and URL for each filing. The dataset is tagged with sec, abs-ee, and asset-backed-securities, and is licensed under GPL.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在资产支持证券(ABS)领域,资产层面的数据对于风险评估与定价模型至关重要。Harley_Davidson_Motorcycle_Trust_2024_B_2034427 数据集基于美国证券交易委员会(SEC)ABS-EE(Asset-Backed Securities Electronic Exhibits)制度构建,系统收录了CIK 2034427(Harley-Davidson Motorcycle Trust 2024-B)自2024年8月31日至2026年2月28日期间提交的19份ABS-EE申报文件。每份申报中的贷款层面数据均从XML附件中提取,并转化为Parquet格式文件,按照“{accession_nodash}/{exhibit_name}.parquet”的层次化结构组织,确保数据溯源清晰。报告周期日期直接源自XML中的reportingPeriodEndingDate字段,保证了时间序列的精确性。
特点
该数据集的核心优势在于其结构化与完整性。19个Parquet文件对应19份申报,总容量为37.2 MB,涵盖摩托车贷款资产池的逐笔贷款信息,为研究摩托车ABS产品底层资产表现提供了高颗粒度的数据基础。通过ABS-EE制度强制披露的标准化格式,数据集具备跨报告期的可比性,便于追踪资产质量、提前还款率、违约率等关键指标的动态演变。此外,数据以Parquet列式存储格式分发,支持高效的压缩与查询,适合大规模统计分析。
使用方法
数据集的使用简便且灵活。用户可直接通过HuggingFace Datasets库加载Parquet文件,或利用Pandas、Dask等Python工具进行本地化处理。每个Parquet文件对应一个申报周期,可结合Filing Index中提供的URL链接回溯至SEC EDGAR原始XML文档,用于验证或补充元数据。对于资产建模任务,推荐按月聚合贷款特征,构建时间序列面板数据,进而应用于违约预测、现金流建模或证券分层分析。注意数据集的GPL许可协议,在衍生作品发布时需遵守相应开源条款。
背景与挑战
背景概述
Harley-Davidson Motorcycle Trust 2024-B数据集由美国证券交易委员会(SEC)根据ABS-EE(Asset-Backed Securities – Electronic Exchange)规则发布,创建于2024年,旨在提供哈雷戴维森摩托车信托(CIK 2034427)的资产支持证券(ABS)资产层级贷款数据。该数据集的核心研究问题聚焦于摩托车贷款证券化的底层资产表现分析,涵盖19份备案文件、37.2 MB的Parquet格式数据,时间跨度从2024年8月至2026年2月。作为金融科技与结构化金融领域的标杆数据集,它为量化信用风险、评估资产池异质性以及验证监管合规性提供了关键资源,对推动ABS透明化研究和机器学习在金融风控中的应用具有深远影响。
当前挑战
该数据集面临的挑战主要体现在两个层面。在领域问题层面,其解决的核心问题是资产支持证券的精细风险评估,传统基于聚合统计的方法难以捕获单体贷款层面的违约动态与提前还款行为,而Harley-Davidson Motorcycle Trust 2024-B通过贷款级XML数据为模型训练提供了高粒度输入。在构建过程中,挑战在于从SEC EDGAR系统中提取并标准化非结构化的XML exhibit数据,需处理 reportingPeriodEndingDate 等字段的格式统一、缺失值填补,以及19份文件跨报告周期的时间对齐与一致性校验,同时确保隐私合规与数据可复现性。
常用场景
经典使用场景
Harley_Davidson_Motorcycle_Trust_2024_B_2034427数据集收录了哈雷戴维森摩托车信托2024-B系列自2024年8月至2026年2月期间共计19份ABS-EE(资产支持证券-资产级)监管申报文件,所有数据均以Parquet格式存储,提取自SEC EDGAR系统中的XML展品。该数据集的经典使用场景在于为资产证券化领域的量化研究提供细粒度的逐笔贷款级数据,使研究者能够追踪摩托车贷款池在19个月报告期内的动态表现,包括还款行为、逾期状态及资产池质量变化,从而为信贷风险建模和ABS定价分析奠定坚实基础。
解决学术问题
该数据集核心解决了资产支持证券研究中长期面临的数据粒度不足问题。传统研究依赖汇总层面信息,难以刻画贷款组合中的异质性风险。通过提供资产级月度面板数据,该数据集助力学者深入探究摩托车贷款ABS的违约驱动因素、提前还款模式以及池内资产相关性结构。这些精细数据对于验证结构信用风险模型、评估分层证券化产品的现金流切割效率具有不可替代的学术意义,显著提升了市场透明度与风险定价理论的实证基础。
衍生相关工作
基于该数据库,研究者可开展多项经典衍生工作。可直接利用资产级面板数据进行机器学习模型训练,预测单笔贷款的违约概率与回收率,进而构建多期随机现金流模型。此外,数据可用于复现或改进ABS信用评级方法,例如对比不同分层结构的损失吸收能力。还可将本数据与其他汽车或消费贷款ABS数据集整合,开展跨资产类别的证券化市场比较研究,探索借款人特征与资产池表现之间的潜在规律,推动结构化金融领域模型创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作