five

DenyTranDFW/Hyundai_Auto_Receivables_Trust_2022_A_1913196

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Hyundai_Auto_Receivables_Trust_2022_A_1913196
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产级别备案文件,涉及CIK 1913196(现代汽车应收账款信托2022-A)。数据集包含36份备案文件,58个Parquet文件,总大小为177.9 MB。报告期从2022年1月31日开始,到2026年2月28日结束。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate。

SEC ABS-EE asset-level filings for CIK 1913196 (Hyundai Auto Receivables Trust 2022-A). The dataset includes 36 filings, 58 parquet files, with a total size of 177.9 MB. The reporting period spans from 2022-01-31 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在现代资产证券化(ABS)市场中,详尽的底层资产数据是精准风险定价与投资决策的基石。Hyundai_Auto_Receivables_Trust_2022_A_1913196数据集正是基于这一需求构建而成,它源自美国证券交易委员会(SEC)的ABS-EE电子化备案系统,专注于现代汽车应收款信托2022-A期的资产层面数据。数据集通过系统化抓取CIK编号1913196对应的全部XML展品档案,提取出每笔贷款的独立特征,并转换为高效的Parquet格式进行存储。所有数据均按‘备案编号_无连字符/展品名称’的层次化目录结构组织,共计包含36份备案文件、58个Parquet文件,总数据量达177.9 MB。报告周期跨度为2022年1月至2026年2月,且每个时间节点的数据均源自原始XML中的‘reportingPeriodEndingDate’字段,确保了时序的完整性。
特点
该数据集的核心特点在于其高度结构化的资产级粒度与严格的合规溯源能力。每一笔贷款数据均直接从SEC法定备案的XML展品中解析而来,排除了中间处理环节的噪音。数据以Parquet列式存储格式呈现,这一选择兼顾了压缩效率与查询性能,特别适合进行大规模时间序列分析与统计建模。值得注意的是,数据集不仅提供了36笔完整备案的资产明细,还包含了部分仅用于更新信息的ABS-EE表格(其报告日期为N/A),这为研究证券存续期内的信息补充机制提供了独特视角。所有Parquet文件均保留与原始SEC归档的直接映射关系,通过备案编号与展品名称即可回溯至原始法律文件,确保了高度的透明性与可审计性。
使用方法
用户可便捷地通过Python数据分析生态(如pandas、Dask)直接读取Parquet文件,结合数据集自带的备案索引表快速筛选特定报告月份的资产快照。对于研究资产池逐月表现、评估现金流分布或构建违约预测模型而言,推荐以‘reportingPeriodEndingDate’字段作为时间键,依序加载并合并各期Parquet文件,形成纵向面板数据。此外,数据集与SEC EDGAR系统深度关联,使用者可通过索引中提供的‘url’字段直接访问原始备案文书,用于验证数据准确性或提取非结构化补充信息。鉴于许可证为GPL,该数据适用于学术研究与开源金融工具的二次开发。
背景与挑战
背景概述
在资产证券化(ABS)领域,透明且结构化的资产级数据对于风险评估、定价模型构建及市场监管至关重要。Hyundai_Auto_Receivables_Trust_2022_A_1913196数据集由SEC EDAR系统提取,聚焦于现代汽车应收账款信托2022-A系列,涵盖自2022年1月至2026年2月的资产级XML披露文件。该数据集由金融数据研究团队整理,旨在解决ABS市场中资产级数据分散、非结构化处理的痛点,为量化分析、违约预测及监管合规研究提供了标准化的时序数据基础。其发布推动了金融科技领域对公开ABS数据源的深度利用,显著提升了证券化产品实证研究的可重复性与透明度。
当前挑战
该数据集所应对的领域核心挑战在于:资产支持证券(ABS)市场长期面临信息不对称问题,投资者与监管机构难以高效获取统一、机读的贷款级数据以评估基础资产池的信用风险、提前偿付模式及现金流稳定性。在构建过程中,主要挑战包括解析SEC XML格式中不一致的字段命名与嵌套结构,需通过自动化工具将36份高频申报文件转化为58个Parquet格式的标准化表格;同时,部分文件缺失报告日期(如首尾注解),需依赖人工校验与逻辑插补来保证时间序列的连续性。此外,数据规模达177.9 MB,包含多期资产池状态变化,处理时需平衡存储效率与分析查询的兼容性。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,Hyundai Auto Receivables Trust 2022-A数据集凭借其涵盖2022年至2026年间长达四年的逐笔贷款级数据,成为分析汽车贷款支持证券表现的核心资源。研究者常利用其详尽的偿付历史、违约与提前还款记录,构建现金流预测模型或评估资产池的信用风险动态。该数据集尤其适用于时间序列分析,用以揭示经济周期波动下汽车贷款借款人的行为模式变化,为资产定价与风险定价提供坚实的实证基础。
衍生相关工作
该数据集衍生出了一系列聚焦于ABS表现归因与预测建模的学术工作。研究者基于其丰富的资产级字段,开发了诸如基于机器学习的违约预警模型,或利用生存分析研究贷款存续期的决定因素。部分工作进一步扩展到比较不同发起机构(如现代汽车金融与其他汽车贷款ABS)的信用表现差异。此外,数据集还催生了关于提前还款行为对证券化现金流路径影响的计量经济学研究,丰富了ABS定价模型的实证检验维度。
数据集最近研究
最新研究方向
在资产证券化(ABS)领域,基于SEC强制披露的ABS-EE数据,研究者正聚焦于汽车贷款资产池的微观信用风险演化与结构化产品定价建模。Hyundai Auto Receivables Trust 2022-A数据集提供了自2022年至2026年间跨越36份申报文件的逐笔贷款级Parquet数据,覆盖从发放到到期的完整生命周期,其精细的时空粒度使得刻画借款人偿付行为、提前还款模式以及违约率动态成为可能。该数据集的公开可及性推动了机器学习模型在ABS违约预测与现金流折现分析上的前沿探索,尤其是在宏观经济波动叠加汽车行业电动化转型的背景下,为量化资产池的尾部风险和动态分层结构奠定了实证基础,对提升次级资产支持证券的透明度和定价效率具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作