DenyTranDFW/California_Republic_Auto_Receivables_Trust_2018_1_1741276
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/California_Republic_Auto_Receivables_Trust_2018_1_1741276
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含CIK 1741276(加利福尼亚共和国汽车应收账款信托2018-1)的SEC ABS-EE资产级别备案文件。数据集包括54份备案文件,211个Parquet文件,总大小为182.4 MB,报告期从2018-05-31至2022-09-30。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。
SEC ABS-EE asset-level filings for CIK 1741276 (California Republic Auto Receivables Trust 2018-1). The dataset includes 54 filings, 211 Parquet files, totaling 182.4 MB, covering the reporting period from 2018-05-31 to 2022-09-30. The Parquet files contain loan-level/asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券-电子化)强制性披露文件,聚焦于California Republic Auto Receivables Trust 2018-1(CIK编号1741276)的资产层面数据。数据集通过解析XML展品,提取了自2018年5月至2022年9月期间共计54份申报文件中的贷款级/资产级信息,最终生成211个Parquet文件,总容量达182.4 MB。每个Parquet文件以{accession_nodash}/{exhibit_name}.parquet格式组织,其报告期依据XML中的“reportingPeriodEndingDate”字段精确标注,构建起一个结构化、时序完整的资产池档案。
特点
本数据集的核心特色在于其精细的资产级粒度与监管合规性。数据涵盖汽车贷款应收账款的逐笔信息,时间跨度逾四年,完整记录了信托存续期内各月的资产表现与现金流动态。依托SEC的ABS-EE框架,数据具有高标准化与可追溯性,每份申报均附带SEC官方网址,便于交叉验证。此外,数据集以高效的Parquet列式存储格式提供,平衡了压缩比与查询速度,尤其适合金融领域的量化分析与机器学习建模需求。
使用方法
用户可通过Python、R或Julia等语言中的Parquet解析库直接读取,例如使用Pandas的read_parquet()函数加载单个文件,或结合Glob模式批量处理全部211个文件。由于数据结构一致且时间索引清晰,研究者可按reportDate字段筛选特定月份或时间区间进行纵向分析。常见应用包括构建汽车ABS的违约率模型、评估提前偿付风险,或利用SEC原始链接进行审计与数据验证。推荐在分析前合并所有Parquet文件形成统一数据集,以提升全量洞察效率。
背景与挑战
背景概述
California Republic Auto Receivables Trust 2018-1 数据集由美国证券交易委员会(SEC)依据ABS-EE(Asset-Backed Securities - Electronic Exhibits)规则收录,创建于2018年,核心研究人员与机构为SEC及其数据合规部门。该数据集聚焦于汽车贷款资产支持证券(Auto ABS)的资产级披露,提供了自2018年5月至2022年9月期间共计54份申报文件、211个Parquet文件,总计182.4 MB的精细贷款层面数据。作为结构化金融领域的重要公开数据源,它填补了资产支持证券透明度研究的空白,为信用风险建模、违约预测及监管合规分析提供了基础性材料,在金融科技与实证资产定价领域具备广泛影响力。
当前挑战
该数据集所解决的领域问题在于汽车贷款ABS市场的信息不对称与风险定价困境:传统评级依赖宏观指标而忽略微观资产动态,数据集的资产级披露使研究者能够从贷款层面解析违约模式与现金流结构。构建过程中面临的挑战包括:从SEC的XML展品中提取并标准化非结构化的资产级数据(如贷款期限、利率、地域分布),确保180余个Parquet文件在时间序列连续性(2018-2022年)与跨申报格式兼容性上的统一,克服原始文件中报告日期(reportingPeriodEndingDate)的缺失与不一致,以及处理因监管更新(如ABS-EE规则修订)导致的数据字段演化问题。
常用场景
经典使用场景
California Republic Auto Receivables Trust 2018-1数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券-电子化发行)强制性披露文件,聚焦于加州共和汽车应收款信托在2018年至2022年期间的资产层级抵押贷款数据。该数据集的经典使用场景在于结构化金融领域的风险管理与定价分析,研究人员可借助其中211个Parquet文件所包含的逐笔贷款还款表现、逾期状态及资产池动态变化,构建信用风险评估模型。同时,其从XML展品中提取的标准化字段,为复现资产证券化(ABS)的现金流瀑布机制提供了基准数据,尤其适合验证不同宏观经济情景下底层资产池的违约概率与损失分布,从而支撑对证券化产品层级结构的精细建模。
实际应用
实际应用中,该数据集服务于金融机构的资产组合优化与压力测试实践。信用评级机构可基于其贷款层级数据校准内部评级模型,监控加州地区汽车贷款池的集中度风险与地域经济波动敏感性。投资银行与对冲基金则利用这些月度更新数据,实时评估所持ABS头寸的现金流折现价值,并在二级市场交易中识别定价偏差。此外,监管机构借助该数据集检验发行人披露信息的准确性,推动ABS市场从依赖发行人假设的“黑箱”模式向数据驱动的透明化评估转型。例如,疫情期间贷款展期政策的实际效果可通过对逾期率与回收率的交叉分析进行实证回溯。
衍生相关工作
该数据集衍生了一系列开创性学术工作,尤以基于机器学习的违约预测研究和结构化产品解构分析为代表。部分研究利用多层感知机或梯度提升树(如XGBoost)整合贷款特征与宏观经济变量,构建了超越传统Logistic回归精度的早期预警系统。另一些工作则聚焦于ABS证券化利差的成因解构,通过将数据集中的贷款级表现与信用评级迁移矩阵相结合,量化了信息不对称对定价偏差的解释力度。此外,围绕CARAT 2018-1数据,还催生了关于贷款服务商行为激励的实证探索——如加速清算策略对投资者回收期限的影响——为后危机时代ABS领域的法律经济学分析提供了可复现的基准证据。
以上内容由遇见数据集搜集并总结生成



