Hyundai_Auto_Receivables_Trust_2022_A_1913196
收藏Hugging Face2026-04-30 更新2026-05-01 收录
下载链接:
https://huggingface.co/datasets/DenyTranDFW/Hyundai_Auto_Receivables_Trust_2022_A_1913196
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产层级备案文件,涉及CIK 1913196(现代汽车应收账款信托2022-A)。数据集包含36份备案文件,58个Parquet文件,总大小为177.9 MB,报告期从2022年1月31日至2026年2月28日。Parquet文件是从XML展品中提取的贷款级/资产级数据,按`{accession_nodash}/{exhibit_name}.parquet`格式组织。报告期日期来源于资产级XML中的`reportingPeriodEndingDate`字段。数据集适用于资产证券化、金融分析及相关研究领域。
创建时间:
2026-04-30
原始信息汇总
数据集概述:Hyundai Auto Receivables Trust 2022-A
该数据集来源于美国证券交易委员会(SEC)的ABS-EE(资产支持证券-电子化)资产级备案,对应CIK编号 1913196(Hyundai Auto Receivables Trust 2022-A)。
基本信息
- 许可证: GPL
- 标签: sec, abs-ee, asset-backed-securities
- 总备案数量: 36 份
- Parquet文件数量: 58 个
- 总数据大小: 177.9 MB
- 报告期起始: 2022-01-31
- 报告期结束: 2026-02-28
数据格式与结构
- Parquet文件提取自XML附件中的贷款级/资产级数据。
- 文件组织方式为:
{accession_nodash}/{exhibit_name}.parquet。 - 报告期日期源自资产级XML中的
reportingPeriodEndingDate字段。
备案索引(示例)
数据集包含36份ABS-EE表格备案,每份备案均对应一个SEC归档地址。以下为部分备案的示例(完整索引见README):
| CIK | 表格类型 | 备案号 | 报告日期 | SEC存档链接 |
|---|---|---|---|---|
| 1913196 | ABS-EE | 0001104659-24-073339 | N/A | https://sec.gov/Archives/edgar/data/1913196/000110465924073339 |
| 1913196 | ABS-EE | 0001104659-22-029639 | 2022-01-31 | https://sec.gov/Archives/edgar/data/1913196/000110465922029639 |
| 1913196 | ABS-EE | 0001104659-26-031964 | 2026-02-28 | https://sec.gov/Archives/edgar/data/1913196/000110465926031964 |
注:备案时间跨度从2022年1月至2026年2月,覆盖了该资产支持证券的完整生命周期数据。
搜集汇总
数据集介绍

构建方式
在资产支持证券(ABS)领域,数据颗粒度是分析信用风险与现金流结构的关键。Hyundai_Auto_Receivables_Trust_2022_A_1913196数据集源自美国证券交易委员会(SEC)的ABS-EE强制性资产层面披露要求,专为现代汽车应收款信托2022-A期次构建。该数据集通过自动化解析SEC EDGAR系统中XML格式的展品文件,提取出逐笔贷款层面的资产明细,并整理为Parquet格式文件。每个文件以存取号去连字符后的标识符与展品名称命名,确保与原始监管申报的对应关系清晰可溯。报告期覆盖从2022年1月至2026年2月的36份申报文件,共计58个Parquet文件,总数据量达177.9 MB,报告截止日期直接源自XML中的reportingPeriodEndingDate字段。
特点
该数据集的核心价值在于其高度的结构化与标准化。一方面,它提供了完整的资产池逐笔贷款数据,涵盖从发行日至最终结算的完整报告周期,为分析汽车贷款应收款的表现演变、违约率与提前偿付行为提供了连续的时间序列基础。另一方面,Parquet格式的采用大幅提升了数据存取效率与存储紧凑性,尤其适合大规模量化分析与机器学习建模场景。数据集严格按照SEC监管架构中的CIK(1913196)与ABS-EE表格类别组织,所有文件均附有对应的SEC官方URL链接,确保了数据来源的权威性与可验证性。这种精细化的资产层面数据,为投资者与研究机构进行现金流建模、敏感性分析与评级验证提供了前所未有的透明度。
使用方法
研究人员可直接通过Hugging Face数据集库加载该集合,利用其Parquet格式优势进行高效的列式数据操作。使用场景涵盖资产证券化市场分析,如追踪特定月份的基础资产逾期率与损失率、构建现金流预测模型,或验证评级机构的假设。数据以accession_nodash/exhibit_name.parquet的目录结构存储,便于按申报批次或展品类型进行选择性读取。用户还可借助Python的pandas库或Dask框架进行高性能的数据聚合与时间序列分析。对于需要构建训练数据集的任务,该资源可作为标记良好的监督学习原始数据源,用于预测贷款违约概率或回收率,从而推动金融科技领域的量化研究向纵深发展。
背景与挑战
背景概述
在资产证券化(ABS)领域,基础资产的逐笔贷款级数据是进行信用风险评估、现金流建模与市场监管的核心依据。Hyundai Auto Receivables Trust 2022-A 数据集由现代汽车金融公司发起,旨在通过美国证券交易委员会(SEC)的ABS-EE(Asset-Level Electronic Filing)制度,系统披露汽车贷款支持证券的底层资产详情。该数据集创建于2022年,涵盖从2022年1月至2026年2月共计36份月度申报文件,包含了58个Parquet格式的资产级数据文件,总规模达177.9 MB。作为现代汽车金融在SEC监管框架下的结构化披露产物,该数据集为研究汽车ABS池的逐笔贷款表现、违约率动态与提前偿付行为提供了罕见的标准化微观样本,对促进二级市场透明度和金融风险建模的精细化具有重要推动力。
当前挑战
该数据集所应对的领域问题在于,传统ABS市场长期面临底层信息碎片化、非结构化甚至缺失的困境,导致投资者难以准确评估资产池的真实信用质量与现金流波动。构建过程中面临的核心挑战包括:其一,从SEC的XML展品中精确提取并标准化逐笔贷款数据,需要应对不一致的字段命名与日期格式;其二,跨越四年多的周期性申报要求确保数据的时序一致性,尤其在不同会计处理规则切换时保持字段定义稳定;其三,原始EDGAR文件仅以XML形式发布,需将其转换为可分析的Parquet格式,这一转换过程必须保留关键的资产期限、利率与还款状态信息,同时防范因数据缺失或重复申报带来的噪声累积。
常用场景
经典使用场景
在现代资产证券化市场中,汽车贷款支持证券(ABS)作为重要的金融工具,其风险定价与信用评估高度依赖于底层资产的细粒度数据。Hyundai Auto Receivables Trust 2022-A数据集提供了现代汽车应收款信托的贷款级资产信息,涵盖从2022年1月至2026年2月共36份ABS-EE申报文件,整理为58个Parquet文件,总容量达177.9 MB。该数据集的经典用途在于支持对汽车ABS基础资产池的微观结构分析,包括贷款发放时的借款人信用评分、贷款金额、利率、期限、地域分布以及车辆类型等特征,从而为资产组合的违约概率预测、提前还款行为建模以及现金流折现分析奠定可靠的数据基础。研究人员能够借此构建自下而上的风险度量模型,模拟不同宏观经济情景下的资产池表现,进而评估分层证券的信用增强效果与评级稳定性。
实际应用
在实际金融操作中,Hyundai Auto Receivables Trust 2022-A数据集为评级机构、资产管理公司以及监管机构提供了不可或缺的决策支持。评级机构可以基于贷款级数据对现代汽车ABS进行独立而审慎的信用评级,通过模拟资产池在不同违约概率和回收率假设下的损失分布,精确测算各层级证券的预期损失与信用增级需求。资产管理公司则能运用该数据优化ABS投资组合的构建与风险管理,例如通过因子模型识别资产池中的系统性风险暴露,动态调整仓位以应对市场波动。监管机构利用此类数据开展压力测试与系统性风险评估,监测汽车ABS市场的集中度风险与潜在违约循环,从而制定更有效的宏观审慎政策。此外,数据集的标准化格式也便于金融机构将其嵌入自动化合规报告系统,提升信息披露的时效性与准确性。
衍生相关工作
以此数据集为依托,学术界与产业界已衍生出一系列富有影响力的研究与实践工作。在机器学习领域,研究者利用贷款级特征训练梯度提升树、随机森林及深度神经网络等模型,实现对资产池逐月违约率的精准预测,并与传统Logistic回归模型对比,揭示了非线性特征交互在信用风险评估中的重要性。在结构性金融领域,学者构建了基于蒙特卡洛模拟的现金流瀑布模型,结合该数据集验证了不同支付优先级结构对高级别证券信用保护水平的影响,为交易结构优化提供了量化依据。此外,该数据还被用于开发自动化的资产证券化信息披露分析工具,通过自然语言处理技术提取XML文件中的关键字段,构建可视化的资产池演变仪表盘。部分研究工作更延伸至绿色金融范畴,分析电动汽车贷款份额对ABS资产表现的影响,探讨可持续发展议题在结构化融资中的经济与信用含义。
以上内容由遇见数据集搜集并总结生成



