five

Hyundai_Auto_Receivables_Trust_2021_A_1853902

收藏
Hugging Face2026-04-30 更新2026-05-01 收录
下载链接:
https://huggingface.co/datasets/DenyTranDFW/Hyundai_Auto_Receivables_Trust_2021_A_1853902
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产层级备案文件,涉及CIK 1853902(现代汽车应收账款信托2021-A)。数据集由47份备案文件组成,包含79个Parquet格式文件,总大小199.1 MB,覆盖报告期为2021年3月31日至2025年7月31日。Parquet文件是从XML附件中提取的贷款级/资产级数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。数据集适用于资产证券化研究、金融数据分析等场景,包含详细的备案索引信息(CIK、表格类型、登记号、报告日期和URL)。数据集采用GPL许可证发布,标签包括sec、abs-ee和asset-backed-securities。
创建时间:
2026-04-30
原始信息汇总

数据集概述:Hyundai Auto Receivables Trust 2021-A

该数据集提供 Hyundai Auto Receivables Trust 2021-A(CIK: 1853902)的 SEC ABS-EE 资产层(asset-level)申报文件。

  • 许可证:GPL
  • 数据标签:SEC、ABS-EE、资产支持证券(asset-backed-securities)

数据集规模

  • 申报文件数量:47 份
  • Parquet 文件数量:79 个
  • 总大小:199.1 MB

时间范围

  • 报告期开始:2021-03-31
  • 报告期结束:2025-07-31

数据格式与结构

  • 数据以 Parquet 格式 存储,内容为从 XML 展品(exhibits)中提取的贷款层/资产层数据。
  • 文件组织方式:{accession_nodash}/{exhibit_name}.parquet
  • 报告期日期源自资产层 XML 中的 reportingPeriodEndingDate 字段。

申报文件索引(部分示例)

数据集包含 47 份 ABS-EE 表格申报,涵盖多个报告日期,下表为部分文件索引:

CIK 表格类型 受理号(Accession Number) 报告日期 SEC 档案链接
1853902 ABS-EE 0001104659-24-073330 N/A https://sec.gov/Archives/edgar/data/1853902/000110465924073330
1853902 ABS-EE 0001104659-21-049650 2021-03-31 https://sec.gov/Archives/edgar/data/1853902/000110465921049650
1853902 ABS-EE 0001104659-25-081335 2025-07-31 https://sec.gov/Archives/edgar/data/1853902/000110465925081335

完整索引包含 2021-03-312025-07-31 期间几乎每个月的申报记录,以及部分未标注报告日期的文件。

搜集汇总
数据集介绍
main_image_url
构建方式
Hyundai_Auto_Receivables_Trust_2021_A_1853902数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化)档案,聚焦于现代汽车应收账款信托2021-A(CIK 1853902)的资产层级披露信息。数据构建过程系统化地从SEC EDGAR系统中爬取并整理了该信托自2021年3月31日至2025年7月31日期间的47份ABS-EE申报文件,生成了79个Parquet格式文件,总容量约199.1 MB。每个Parquet文件对应特定申报文件中的XML附件,文件命名遵循“{accession_nodash}/{exhibit_name}.parquet”的规范,其中报告期日期依据资产层级XML中的“reportingPeriodEndingDate”字段精确提取,确保了数据颗粒度的精细与时间序列的完整性。
特点
该数据集的核心特点在于其高度结构化的资产层级数据,提供了现代汽车应收账款信托2021-A在长达四年多的存续期内每一笔基础资产的详细动态。数据以Parquet列式存储格式呈现,兼顾了压缩效率与分析性能,尤其适合处理海量金融时序数据。此外,数据集附有完整的申报文件索引,涵盖CIK、申报形式(ABS-EE)、接入编号、报告日期及SEC官网链接,便于用户溯源验证。其时间跨度覆盖了从信托成立初期至近期的最新报告,能够支持对资产池表现、现金流分布及信用风险演变的纵向追踪分析。
使用方法
使用该数据集时,用户可通过Python中的pandas库直接读取Parquet文件,例如使用‘pd.read_parquet()’函数加载单个或批量资产层级数据。由于数据集按申报文件组织,建议用户先利用提供的文件索引表格,按报告日期或接入编号筛选感兴趣的时段,再定位至对应的Parquet文件进行深入分析。数据字段均源自SEC官方XML披露,可直接用于构建资产池的统计描述、违约率计算、提前偿付模型或信用评级验证等量化研究。用户亦可跨文件合并数据,以形成连续时间序列,进而支持对信托整体表现演变的动态建模。
背景与挑战
背景概述
在资产证券化(ABS)领域,基于资产的透明信息披露是提升市场效率与投资者信心的关键。Hyundai Auto Receivables Trust 2021-A数据集由美国证券交易委员会(SEC)的ABS-EE(Asset-Backed Securities Exchange Electronic)项目于2021年创建,聚焦于现代汽车金融子公司发行的汽车贷款资产支持证券。该数据集包含47份法定备案文件和79个Parquet格式的资产层级数据,覆盖从2021年3月至2025年7月的完整报告周期,总规模达199.1 MB。其核心研究问题在于通过细粒度贷款级数据的结构化抽取,揭示汽车ABS的资产表现、违约风险与现金流动态。作为SEC加强ABS监管的实践成果,该数据集为金融科技、量化风控及结构化金融研究提供了高颗粒度的真实市场样本,推动了资产证券化领域从宏观统计向微观资产分析的范式转型。
当前挑战
该数据集所解决的领域问题主要在于弥补传统ABS研究中资产层级数据缺失的短板,使研究者能够从逐笔贷款追踪还款行为、提前偿付率和信用风险演变,从而精准建模资产池的预期损失与现金流波动。然而,构建过程中面临多重挑战:首先,XML格式的非标准化报表需要复杂的解析逻辑以提取结构化字段,尤其是跨时期字段名称与数据类型的动态变化增加了清洗难度;其次,数据集成时需对齐不同备案日期对应的贷款池变动,确保时序一致性;最后,大规模原始数据的压缩与Parquet格式转换需兼顾查询效率与存储优化,同时维护47个备案文件间的关系完整性,这对数据处理管道的稳健性提出了严苛要求。
常用场景
经典使用场景
Hyundai_Auto_Receivables_Trust_2021_A_1853902 数据集汇聚了现代汽车应收账款证券化信托(Hyundai Auto Receivables Trust 2021-A)自2021年3月至2025年7月期间,向美国证券交易委员会(SEC)提交的ABS-EE表格资产层级申报数据。该数据集以Parquet格式存储了79个文件,涵盖47份申报材料,每份文件均对应特定报告周期的逐笔贷款信息。研究者可基于这些细粒度资产数据,对汽车贷款证券化产品进行穿透式分析,包括追踪贷款池的逾期率、提前还款率、违约率等关键绩效指标的动态演变,以及评估不同信用评分档位贷款的回收表现。其经典用途在于为资产支持证券(ABS)的量化风险建模提供原始底层数据支撑。
解决学术问题
在金融学术研究中,该数据集有效解决了证券化产品因底层资产信息不透明而难以进行精确评估的难题。传统研究中,ABS的信用风险分析多依赖于评级机构发布的分层汇总数据,缺乏逐笔贷款的微观视角。借助该数据集,学者得以深入剖析汽车贷款ABS的违约驱动因子,例如借款人地域分布、贷款价值比(LTV)、剩余期限等协变量对履约行为的影响。此外,其长达四年的持续报告周期,为研究宏观环境变化(如利率波动)对贷款组合表现的影响提供了宝贵的纵向数据。这一数据集的出现,推动了从静态评级模型向动态、数据驱动的违约预测模型的学术转向。
衍生相关工作
基于该数据集,已衍生了若干具有影响力的实证研究工作。例如,学者通过对比不同汽车制造商背景的ABS产品违约差异,探讨了品牌忠诚度对贷款回收率的影响。另有工作利用该数据集的贷款粒度特征,结合生存分析(Cox比例风险模型)刻画了提前还款行为的时间依赖性。在金融科技领域,研究者将其作为基准数据集,设计端到端的深度学习框架(如Transformer时序预测模型)来模拟贷款池的累计损失曲线。此外,部分开源项目基于该数据集开发了可视化仪表盘,实时展示资产证券化市场的运行状况,促进了金融数据科学社区的协作与发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作