five

DenyTranDFW/Hyundai_Auto_Receivables_Trust_2022_C_1949662

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Hyundai_Auto_Receivables_Trust_2022_C_1949662
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集涉及美国证券交易委员会(SEC)ABS-EE资产级别文件,具体为CIK 1949662(现代汽车应收账款信托2022-C)的相关数据。包含37份文件,53个Parquet文件,总大小为195.1 MB,报告期从2022-09-30至2026-02-28。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 1949662 (Hyundai Auto Receivables Trust 2022-C). Includes 37 filings, 53 parquet files, with a total size of 195.1 MB. Reporting period spans from 2022-09-30 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在资产支持证券(ABS)领域,底层资产的透明披露是市场信任与风险定价的基石。该数据集聚焦于现代汽车应收款信托2022-C(CIK 1949662),通过系统化爬取美国证券交易委员会(SEC)EDGAR系统中ABS-EE表格的XML附件,提取出贷款层面或资产层面的精细化数据。所有原始数据均以Parquet格式存储,并按照申报编号去除连字符后的格式与附件名称组织成层级化的文件结构,共包含37份申报文件、53个Parquet文件,总容量达195.1 MB。数据集时间跨度从2022年9月30日至2026年2月28日,每个资产的报告周期截止日期均源自XML中的`reportingPeriodEndingDate`字段,确保时间维度上的精确对齐。
特点
该数据集最显著的优势在于其高度结构化的资产级粒度与长时间序列的连续性。它完整收录了现代汽车应收款信托2022-C自成立以来每个月的资产表现数据,为研究者提供了一份涵盖近四年、逐月更新的动态资产池快照。每个Parquet文件内包含了诸如贷款余额、利率、逾期状态、地域分布等关键字段,使得底层资产的信用质量与现金流的演变轨迹得以清晰呈现。此外,数据集与SEC官方申报的URL直接关联,便于用户交叉验证原始披露文件,极大增强了数据的可追溯性与可信度。
使用方法
使用者可通过HuggingFace Datasets库直接加载该数据集,利用其内置的Parquet读取功能快速获得Pandas DataFrame格式的数据。推荐按时间顺序或按资产池编号对多个Parquet文件进行合并与分析,以构建完整的资产表现面板数据。对于专注于结构化金融与风险建模的研究者,可以基于贷款层面的逾期率、违约率与提前偿付率等指标,评估资产池的信用风险演变规律。同时,由于数据集中提供了每份申报文件的SEC访问链接,用户可便捷地查阅原始XML附件,用于验证字段映射或补充非结构化文本信息。
背景与挑战
背景概述
Hyundai Auto Receivables Trust 2022-C数据集由美国证券交易委员会(SEC)基于ABS-EE表格构建,旨在提供现代汽车应收账款支持证券的资产级贷款数据。该数据集涵盖2022年9月至2026年2月的报告周期,包含37份申报文件、53个Parquet文件,总规模达195.1 MB,涉及资产支持证券领域的核心研究问题,即如何通过透明化底层资产信息来评估证券化产品的信用风险与现金流表现。作为金融科技与结构化金融领域的重要资源,该数据集为量化分析汽车贷款违约率、提前还款行为及资产组合表现提供了标准化样本,推动了金融监管数据挖掘与风险建模的实证研究,尤其对资产支持证券定价模型与投资者决策优化具有显著影响力。
当前挑战
该数据集所解决的领域挑战主要在于资产支持证券市场的透明度不足问题,传统上投资者难以获取细粒度资产级信息以评估底层贷款质量,从而面临信息不对称引发的道德风险与定价偏差。构建过程中面临的挑战包括:从SEC EDGAR系统中海量非结构化XML摘要中提取贷款级数据,需处理多层级嵌套标签的解析难题;确保37份文件跨时间序列的数据一致性,应对报告日期、资产状态变更等字段的标准化问题;以及维护195.1 MB文件在存储与读取时的完整性,避免因数据格式转换导致的缺失或错误记录。
常用场景
经典使用场景
Hyundai_Auto_Receivables_Trust_2022_C_1949662数据集的核心价值在于其为资产支持证券(ABS)领域提供了颗粒度极细的逐笔贷款级别数据。研究者常利用该数据集剖析汽车贷款ABS的资产池结构,通过追踪从2022年9月至2026年2月期间37份ABS-EE表格中披露的贷款层面信息,深入探究贷款本金余额、利率分布、剩余期限及地域集中度等关键特征。该数据集独特的时序特性使其成为评估资产池信用质量演变、构建提前偿付与违约风险模型的理想基石,为解析结构化金融产品的底层资产动态提供了不可多得的实证素材。
解决学术问题
该数据集直接回应了金融学界关于资产证券化信息不对称与透明度议题的长期关切。通过提供标准化的逐笔贷款数据,它破解了以往研究仅能依赖聚合层面信息的困境,使得学者能够精确量化贷款异质性对证券化产品定价和风险溢价的微观影响。数据集涵盖的完整存续期记录,助力于检验信息摩擦理论在ABS市场中的适用性,并揭示了结构化金融创新如何在分散风险与隐匿风险之间寻求平衡。其存在极大促进了关于评级机构评级准确性与底层资产真实质量之间关系的实证检验,深化了市场参与者对证券化链条中代理问题的理解。
衍生相关工作
该数据集的发布催生了一系列以结构化金融数据挖掘为核心的学术与工程探索。基于其标准的Parquet格式与SEC XML展品结构,衍生出若干用于批量解析和标准化ABS数据的开源工具库,显著降低了研究者访问SEC EDGAR系统原始文档的门槛。在方法论上,它推动了图神经网络在贷款-证券抵押关系图谱上的应用,以捕捉资产池内隐性风险传播路径。同时,时序异常检测算法被引入以识别ABS-EE披露中的潜在数据谬误或操纵迹象,这些工作共同构建了从数据清洗到高级金融语义理解的研究范式,并反哺了金融科技领域内可解释性机器学习模型的开发浪潮。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作