DenyTranDFW/Hyundai_Auto_Receivables_Trust_2022_B_1932485
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Hyundai_Auto_Receivables_Trust_2022_B_1932485
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别文件,针对CIK 1932485(现代汽车应收账款信托2022-B)。数据集包含33份文件,51个Parquet文件,总大小为157.8 MB。报告期从2022-05-31至2026-02-28。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。
SEC ABS-EE asset-level filings for CIK 1932485 (Hyundai Auto Receivables Trust 2022-B). The dataset includes 33 filings, 51 parquet files, with a total size of 157.8 MB. The reporting period spans from 2022-05-31 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,聚焦于现代汽车应收款信托2022-B(CIK 1932485)的资产层面披露文件。通过系统性地爬取与解析XML格式的展品文件,将其中蕴含的贷款级/资产级数据提取并转化为结构化的Parquet格式文件。数据组织方式以SEC的接入号(accession number)去连字符后的字符串为顶层目录,内部按展品名称存放对应的Parquet文件,共计33份申报、51个Parquet文件,涵盖从2022年5月至2026年2月的报告周期,时间跨度近四年。每个资产级别XML中的报告期末日期(reportingPeriodEndingDate)被用来标注各申报表的报告时间,确保了时序上的精确对齐。
特点
本数据集最显著的特点是其高度精细的资产级粒度与长期的时间序列覆盖。区别于常规的汇总统计,这里呈现了每一笔汽车贷款的逐月表现数据,为研究者提供了微观层面的信用风险与现金流分析可能。数据来源直接锚定SEC官方备案,具有法定监管披露的权威性与一致性。Parquet格式的采用不仅大幅压缩了存储空间(总量仅157.8 MB),还凭借列式存储的特性优化了分析查询效率。此外,数据集完整收录了从启动发行至最终清算的全部33次申报,无间断地记录了资产的完整生命周期,是研究汽车ABS产品表现与违约模式的珍贵时间序列档案。
使用方法
使用者可通过Python数据分析生态中的pandas库直接从Parquet文件中加载数据,利用`read_parquet`函数即可将资产级信息读入DataFrame。各申报的数据按`{accession_nodash}/{exhibit_name}.parquet`路径独立存放,便于按具体申报或展品进行切片分析。若需合并跨周期的资产表现,可利用报告的`reportingPeriodEndingDate`字段作为时间标识进行纵向拼接。所有Parquet文件可批量读取并全局整合,构成一个包含多个月度观测值的面板数据集。借助该数据结构,用户可高效开展逾期率、累计损失率、提前还款率等关键指标的动态测算,或构建时间序列模型以预测资产池的未来表现。
背景与挑战
背景概述
该数据集由现代汽车应收账款信托(Hyundai Auto Receivables Trust 2022-B)的资产支持证券(ABS)项目驱动,基于美国证券交易委员会(SEC)的ABS-EE规则,以结构化金融数据的形式于2022年首次公开披露。核心研究问题聚焦于汽车贷款资产层面的标准化信息提取与透明度提升,旨在为金融市场参与者提供细粒度的逐笔贷款数据。作为ABS-EE领域的标杆性数据集,它通过提供33份申报文件、51个Parquet文件及长达近四年的报告周期(2022年5月至2026年2月),为资产定价、风险建模及监管合规研究奠定了坚实基础,显著推动了证券化市场的量化分析进程。
当前挑战
该数据集主要面临两重挑战。在领域问题层面,汽车资产支持证券的信用风险评估常受限于底层贷款池的黑箱性,数据集通过披露逐笔贷款的还款状态、期限结构等资产级信息,解决了透明度不足导致定价偏差的核心难题。在构建过程中,挑战源于从非结构化XML展品中提取标准化数据的复杂性,需对33份不同格式的申报文件进行解析,并处理报告日期跨度的不连续性(如2023年数据缺失9至10月),同时确保51个Parquet文件间的字段一致性与时间对齐,最终实现157.8 MB数据的高效整合与批量导入。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,Hyundai Auto Receivables Trust 2022-B 数据集为学者提供了一个精准且详尽的微观数据基础,用于剖析汽车贷款支持证券的资产池动态。该数据集包含从2022年5月至2026年2月的贷款级别月度表现数据,共计51个Parquet文件,覆盖了33份SEC ABS-EE备案文件。研究者能够利用这些数据对每一笔贷款的偿还情况、逾期状态及违约模式进行逐月追踪,从而构建复杂的现金流预测模型,并评估资产池的信用风险结构。
解决学术问题
该数据集解决了传统ABS研究中普遍面临的数据颗粒度不足与披露不透明问题。以往,由于缺乏标准化的贷款级别数据,学者难以精确量化借款人的偿付行为对现金流时序的影响。借助此数据集,学术研究得以深入探究证券化产品的提前偿付风险、违约概率与损失严重性之间的内在关联,并验证基于宏观因子或个体特征的风险定价理论。这些工作的推进显著提升了证券化市场信用评估的精度,并为监管机构优化ABS信息披露标准提供了实证依据。
衍生相关工作
围绕该数据集衍生出的相关工作主要集中在违约风险建模与现金流预测领域。已有研究表明,利用此类贷款级别数据训练的机器学习模型,如梯度提升树与长短期记忆网络,能够显著提升对汽车ABS资产池损失规模的预测准确性。同时,基于此数据集的实证分析也催生了关于提前偿付行为中“休眠状态”与非线性效应的深入讨论。在金融统计领域,部分学者进一步构建了状态空间模型,以揭示宏观经济周期变化如何通过贷款特征传导至证券化产品的表现,从而推动了ABS风险计量框架的持续迭代与创新。
以上内容由遇见数据集搜集并总结生成



