Hyundai_Auto_Receivables_Trust_2020_C_1826501
收藏Hugging Face2026-04-30 更新2026-05-01 收录
下载链接:
https://huggingface.co/datasets/DenyTranDFW/Hyundai_Auto_Receivables_Trust_2020_C_1826501
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产层级备案文件,涉及CIK 1826501(现代汽车应收账款信托2020-C)。数据集包含49份备案文件,共计82个Parquet文件,总大小为202.5 MB,覆盖的报告期为2020年9月30日至2025年3月31日。Parquet文件是从XML展品中提取的贷款级/资产级数据,按`{accession_nodash}/{exhibit_name}.parquet`格式组织。报告期日期源自资产级XML中的`reportingPeriodEndingDate`字段。数据集适用于资产证券化、金融分析和风险评估等任务。
创建时间:
2026-04-30
原始信息汇总
数据集概述:Hyundai Auto Receivables Trust 2020-C
基本信息
- 数据集名称:Hyundai Auto Receivables Trust 2020-C
- CIK 编号:1826501
- 许可协议:GPL
- 标签:sec, abs-ee, asset-backed-securities
数据来源与内容
本数据集包含美国证券交易委员会(SEC)ABS-EE 资产层面的申报文件,对应主体为 Hyundai Auto Receivables Trust 2020-C。数据提取自 XML 展品中的贷款层面或资产层面数据,并以 Parquet 格式存储。
数据规模
- 申报文件数量:49 份
- Parquet 文件数量:82 个
- 总大小:202.5 MB
报告覆盖时间范围
- 起始日期:2020-09-30
- 结束日期:2025-03-31
数据组织方式
Parquet 文件按 {accession_nodash}/{exhibit_name}.parquet 的格式组织。报告期日期源自资产层面 XML 中的 reportingPeriodEndingDate 字段。
申报文件索引(节选)
该数据集包含从 2020 年 9 月至 2025 年 3 月的月度 ABS-EE 申报记录,涵盖以下部分示例:
| 报告日期 | 文件链接 |
|---|---|
| 2020-09-30 | https://sec.gov/Archives/edgar/data/1826501/000110465920114472 |
| 2020-12-31 | https://sec.gov/Archives/edgar/data/1826501/000110465921005186 |
| 2021-06-30 | https://sec.gov/Archives/edgar/data/1826501/000110465921096810 |
| 2022-03-31 | https://sec.gov/Archives/edgar/data/1826501/000110465922050933 |
| 2023-11-30 | https://sec.gov/Archives/edgar/data/1826501/000110465923128156 |
| 2024-12-31 | https://sec.gov/Archives/edgar/data/1826501/000110465925005196 |
| 2025-03-31 | https://sec.gov/Archives/edgar/data/1826501/000110465925037931 |
完整的 49 份申报文件索引可在数据集的 README 文件中查看,所有文件均以 ABS-EE 表格形式提交,CIK 均为 1826501。
搜集汇总
数据集介绍

构建方式
在资产支持证券(ABS)领域,详尽的资产层级数据是进行风险评估与定价分析的基石。Hyundai_Auto_Receivables_Trust_2020_C_1826501 数据集通过系统抓取美国证券交易委员会(SEC)EDGAR系统中CIK编号为1826501的实体所提交的ABS-EE表格XML附件,将其中蕴含的贷款层级信息提取并转化为结构化的Parquet文件。每个Parquet文件以受理编号(accession number)与附件名称(exhibit name)为命名规则,并按报告期间结束日期(reportingPeriodEndingDate)进行组织,最终汇聚为49份备案文件、82个Parquet文件、总计202.5 MB的数据集合,涵盖2020年9月30日至2025年3月31日的完整报告周期。
特点
该数据集的核心特色在于其精细化与标准化处理的资产层级数据,完整呈现了现代汽车应收账款信托2020-C系列下每一笔贷款在长达四年半时间窗口内的逐月演化轨迹。数据覆盖了从初始发行至存续期结束的多个报告节点,为研究者提供了纵向连贯的资产表现视图。Parquet格式确保了数据的高效存储与快速读取,且所有数据均直接源自SEC的法定披露文件,具有权威性与可溯源性。此外,数据集以开放许可(GPL)发布,降低了学术与行业应用的门槛,提升了资本市场的透明度。
使用方法
使用该数据集时,研究者可通过HuggingFace数据集加载工具直接访问,或下载Parquet文件后利用Pandas、Dask等Python库进行解析与操作。由于数据按备案(filing)与附件组织,用户可根据报告日期或受理编号筛选特定时间窗口或交易事件对应的资产池快照。结合SEC EDGAR提供的索引信息,数据可轻松与发行文件中的其他结构化或非结构化信息进行关联,适用于资产证券化的现金流建模、违约率预测、早偿率分析以及基于机器学习的风险因子挖掘等深度研究场景。
背景与挑战
背景概述
Hyundai Auto Receivables Trust 2020-C数据集归属于资产支持证券(ABS)领域,专注于汽车贷款证券化产品的微观结构解析。该数据集由美国证券交易委员会(SEC)依据ABS-EE法规强制披露的资产层级XML文件衍生而来,创建于2020年,覆盖从2020年9月30日至2025年3月31日的完整报告周期,共包含49份申报文件与82个Parquet文件,总数据量达202.5 MB。核心研究问题聚焦于通过细颗粒度的贷款级数据,揭示汽车ABS池的信用风险演化、提前偿付行为及现金流分布特征。该数据集为金融监管合规分析、结构化金融风险建模及机器学习驱动的资产定价研究提供了高时效性、标准化的基准资源,尤其推动了透明化披露在证券化市场中的实证应用。
当前挑战
首要挑战在于资产支持证券领域的信息不对称问题,传统ABS市场因底层资产池的异质性和披露颗粒度不足,导致投资者难以精准评估信用风险与提前偿付风险,该数据集通过标准化XML模式转化,解决了数据碎片化与可比性缺失的核心障碍。构建过程中面临的技术挑战包括:将非结构化的SEC EDGAR XML文件解析为结构化Parquet格式,需处理跨报告周期的数据一致性(如不同时期Schema的变异),以及应对49份申报文件中潜在的数据缺失、日期格式不一致(如缺失报告日期的条目)和大型附件的存储压缩效率,最终依托GPL协议实现开源,但长期维护需依赖社区对SEC披露政策变化的持续适配。
常用场景
经典使用场景
Hyundai Auto Receivables Trust 2020-C数据集收录了现代汽车金融公司发行的汽车贷款支持证券的逐笔资产层面数据,涵盖自2020年9月至2025年3月近五年的申报周期。其经典使用场景聚焦于剖析汽车资产支持证券的底层贷款表现,包括贷款余额、还款历史、逾期状态及提前偿付行为等动态指标。研究者可通过这些细粒度信息揭示资产池的信用风险演变规律,尤其适用于构建贷款违约预测模型和现金流压力测试框架。
衍生相关工作
围绕该数据集衍生出一系列奠基性工作,例如基于时间序列的贷款绩效归因研究,运用生存分析或机器学习技术识别早期违约预警信号。另有研究者将其与宏观因子耦合,构建汽车贷款ABS的联合信贷风险模型。此外,该数据常被用于验证替代性信用评分方法,以及作为基准训练智能合约中的自动化风控模块,推动金融科技与证券化实践的深度融合。
数据集最近研究
最新研究方向
在资产证券化(ABS)领域,Hyundai_Auto_Receivables_Trust_2020_C数据集为汽车贷款支持证券的精细化风险建模与监管合规研究提供了弥足珍贵的结构化资产级时序数据。近期前沿方向聚焦于利用该数据集涵盖2020年至2025年间49份SEC ABS-EE备案文件的82个Parquet文件,开展贷款池违约概率的机器学习预测、现金流压力测试的蒙特卡洛模拟,以及基于XML报表解析的信用风险传导机制量化分析。这一高颗粒度数据资源还推动了新巴塞尔协议框架下资产池同质性检验与评级迁移矩阵研究,为应对后疫情时代汽车金融市场的波动性挑战提供了实证支撑。
以上内容由遇见数据集搜集并总结生成



