five

DenyTranDFW/Carvana_Auto_Receivables_Trust_2022_P1_1903763

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Carvana_Auto_Receivables_Trust_2022_P1_1903763
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含SEC ABS-EE资产级别的文件,具体针对Carvana Auto Receivables Trust 2022-P1(CIK 1903763)。数据集包含50个文件,86个Parquet文件,总大小为141.3 MB,报告期从2022年2月28日至2026年3月31日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK **1903763** (Carvana Auto Receivables Trust 2022-P1). The dataset includes 50 filings, 86 Parquet files, with a total size of 141.3 MB, covering the reporting period from 2022-02-28 to 2026-03-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as `{accession_nodash}/{exhibit_name}.parquet`. Reporting-period dates are derived from the asset-level XML (`reportingPeriodEndingDate`).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
在资产支持证券(ABS)领域,Carvana Auto Receivables Trust 2022-P1数据集围绕美国证券交易委员会(SEC)的ABS-EE监管框架构建,聚焦于CIK编号1903763对应的特定资产组合。该数据集通过系统抓取SEC EDGAR系统中的XML附件,将50份ABS-EE申报文件中的逐笔贷款与资产级数据提取并整理为86个Parquet文件,总数据量达141.3 MB。每个Parquet文件以{accession_nodash}/{exhibit_name}.parquet的命名规则组织,确保文件来源可追溯。此外,数据集从XML中解析出报告期结束日期(reportingPeriodEndingDate),覆盖2022年2月至2026年3月的完整周期,为时间序列分析提供了精准的时间戳基础。
特点
该数据集最突出的特点在于其资产级颗粒度与监管合规性。它完整收录了Carvana Auto Receivables Trust 2022-P1在长达四年间的逐月申报数据,包含从2022年2月28日至2026年3月31日共计50个报告期的历史财务信息。每个报告期的数据均以标准化的Parquet格式存储,这种高效列式存储格式不仅压缩了存储空间,还支持大规模数据的高效读取与分析。数据集还附带了详尽的申报索引表,列出每份文件的CIK编号、申报表格类型、接入号及SEC官方链接,极大便利了数据的定位与来源验证。这种结构化、机器可读的设计,使其成为研究汽车贷款ABS绩效、违约风险及证券化市场动态的理想样本。
使用方法
使用该数据集时,用户可通过Hugging Face Datasets库加载Parquet文件,并基于reportDate字段筛选特定报告期的资产级数据。例如,利用Python的pandas库读取Parquet文件后,可依据来自SEC EDGAR的原始XML数据对贷款余额、利率、还款状态等字段进行聚合分析。数据集中的url字段提供了每份申报文件的直接访问链接,便于用户交叉验证原始监管文件。对于时间序列分析,可直接利用reportingPeriodEndingDate字段构建动态面板数据,追踪资产池绩效的演变趋势。此外,研究者可将不同CIK对应的ABS数据集合并,构建跨信托的对比分析基准。
背景与挑战
背景概述
资产支持证券(ABS)作为结构化金融产品的重要分支,其透明性与数据可溯性对市场风险定价与监管合规具有关键意义。Carvana Auto Receivables Trust 2022-P1(CARV 2022-P1)数据集由SEC EDGAR系统公开的ABS-EE资产层级备案文件整理而成,聚焦于Carvana公司于2022年发起的汽车贷款证券化交易。该数据集涵盖2022年2月至2026年3月的月度贷款层面数据,包含50份申报文件与86个Parquet文件,总容量141.3 MB,通过标准化XML提取与组织,为量化分析汽车ABS的现金流表现、违约风险及结构设计提供了高颗粒度的时序数据基础。作为公开可用的金融数据集,它填补了汽车ABS领域细粒度贷款级数据资源的空白,推动了结构化金融实证研究的前沿探索。
当前挑战
该数据集所应对的核心领域挑战在于:汽车ABS市场长期面临贷款层级信息不透明、标准化程度低的问题,传统数据分析依赖发行方汇总报告,难以对资产池进行细粒度风险建模与压力测试。构建过程中亦遭遇多重技术障碍:首先,SEC的ABS-EE XML文件格式复杂且随时间演化,需解析嵌套标签并协调跨时段的字段定义差异;其次,原始数据包含非结构化文本与缺失值,需设计自动化清洗流程以维持时间序列的完整性;最后,高频更新的月度申报要求持续监控EDGAR新文件,并确保Parquet格式转换与索引对齐的误差控制在可接受范围内,最终在141.3 MB数据量级上实现高精度的结构化重建。
常用场景
经典使用场景
在资产证券化(ABS)研究领域,Carvana Auto Receivables Trust 2022-P1 数据集旨在为学者和分析师提供一个细粒度的单笔贷款层面数据源。该数据集从美国证券交易委员会(SEC)的ABS-EE电子化申报文件中提取,涵盖了自2022年2月至2026年3月的完整报告周期。其最常见的用途是用于构建和验证汽车贷款支持证券的信用风险模型、现金流预测模型以及贷款池的违约与提前偿还行为分析。研究者可以借助此数据集深入剖析贷款组合的表现,并探索宏观经济因素对资产池质量的影响。
实际应用
在实际业务场景中,该数据集可被投资机构、风险管理团队和监管科技公司用于对Carvana 2022-P1信托的实时监控和压力测试。通过解析这份资产级数据,金融机构能够动态评估贷款池的边际违约概率和预期损失,从而辅助做出更精准的投资决策与风险评估。同时,它也能服务于金融科技领域中的自动化披露核查和合规性审核,提升ABS市场的数据透明度和运行效率。
衍生相关工作
该数据集衍生了一系列具有影响力的学术与产业工作,包括开发基于机器学习的贷款违约预测模型和时序现金流模拟工具。部分研究已将其与SEC其他发行人的ABS-EE数据合并,形成跨产品、跨期限的比较分析框架。此外,审计与评级机构利用此数据集改进了传统的压力测试方法,催生了更完善的证券化产品定价模型和风险分层策略,为行业标准提供了持续更新的数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作