DenyTranDFW/Bridgecrest_Lending_Auto_Securitization_Trust_2025_1_2050168
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Bridgecrest_Lending_Auto_Securitization_Trust_2025_1_2050168
下载链接
链接失效反馈官方服务:
资源简介:
Bridgecrest Lending Auto Securitization Trust 2025-1数据集包含SEC ABS-EE资产级别的文件,涉及CIK 2050168。数据集包含17个文件,总大小为41.7 MB,报告期从2024年12月31日至2026年3月31日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按照{accession_nodash}/{exhibit_name}.parquet的方式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate。
SEC ABS-EE asset-level filings for CIK 2050168 (Bridgecrest Lending Auto Securitization Trust 2025-1). The dataset includes 17 filings with a total size of 41.7 MB, covering the reporting period from 2024-12-31 to 2026-03-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,专门收录Bridgecrest Lending Auto Securitization Trust 2025-1(CIK编号2050168)的资产层级申报文件。通过系统性地抓取XML附件中的逐笔贷款与资产层级数据,并将其转化为Parquet格式文件,共形成17份申报记录与对应文件。数据集的构建严格遵循SEC EDGAR公开披露机制,文件以{accession_nodash}/{exhibit_name}.parquet结构组织,确保每一份资产层级数据的完整性与可追溯性。
特点
该数据集的核心特征在于其高度细颗粒度与标准化结构。作为资产支持证券领域的专业数据资源,它覆盖了从2024年12月31日至2026年3月31日的完整报告周期,包含17份Parquet文件,总容量约41.7 MB。数据集中的每一条记录均可通过唯一的accessionNumber(如0000950131-25-000241)进行精确定位,并附带对应的SEC申报链接,便于交叉验证。此外,报告日期直接提取自XML中的reportingPeriodEndingDate字段,确保了时间戳的准确性,为时序分析和资产表现建模提供了坚实基础。
使用方法
该数据集可直接通过HuggingFace平台加载使用。研究人员可利用Python的pandas库读取Parquet文件,结合SEC提供的CIK编号与accessionNumber进行数据筛选与整合。具体使用时,建议首先将{accession_nodash}/{exhibit_name}.parquet路径映射至本地或内存,随后通过时间序列方法分析贷款层级的表现指标,如违约率、提前偿付率等。数据集亦支持与外部财务数据库进行链接,用于资产支持证券的信用风险评估与证券化结构建模,特别适合量化金融和金融科技领域的实证研究。
背景与挑战
背景概述
资产支持证券(ABS)作为金融市场的重要工具,其信息披露的透明度与标准化程度直接关系到市场风险定价与投资者保护。Bridgecrest Lending Auto Securitization Trust 2025-1数据集创建于2025年,由SEC(美国证券交易委员会)通过EDGAR系统公开的ABS-EE(资产支持证券资产级数据)格式化申报文件中提取而来,核心研究问题聚焦于汽车贷款资产支持证券的资产级数据标准化与结构化分析。该数据集涵盖了2024年12月至2026年3月期间共17份申报文件,以Parquet格式存储总计41.7MB的贷款级数据,为金融科技、资产定价及风险管理领域提供了高颗粒度的实证基础,对推动资产证券化市场的计量分析与监管科技发展具有重要价值。
当前挑战
该数据集所解决的领域问题在于破解ABS市场中资产级数据分散、非结构化且难以机器读取的困境,过去研究者与投资者需手动解析繁复的XML申报文件,效率低下且易出错。构建过程中挑战显著:首先,不同申报期的资产数据结构可能存在差异,需统一映射至标准化的Parquet格式;其次,从XML中准确提取‘reportingPeriodEndingDate’等关键字段,需克服潜在的标签命名不一致与缺失值问题;此外,确保跨时间序列(2024年至2026年)数据的一致性,同时通过GPL许可合规地公开清洗后数据,亦对数据治理与版本控制提出严苛要求。
常用场景
经典使用场景
该数据集聚焦于Bridgecrest Lending Auto Securitization Trust 2025-1的资产支持证券(ABS)领域,包含了自2024年12月至2026年3月期间共17份SEC ABS-EE申报文件中的逐笔贷款级数据。其经典使用场景在于为金融领域的研究者提供详尽的逐笔贷款层面信息,用于分析汽车贷款证券化产品的资产池构成、信用风险分布及现金流表现。通过解析这些Parquet格式的结构化数据,学者能够模拟不同经济情境下资产池的违约损失率,构建精密的定价模型,并评估证券化交易的结构化特征对风险收益特征的影响。
解决学术问题
在学术研究中,该数据集有效解决了汽车贷款证券化领域长期面临的数据颗粒度不足与透明度有限的核心难题。传统研究往往只能依赖汇总层面的披露,难以深入探究个体贷款特征与整体资产池表现之间的因果关联。借助此数据集,研究者能够精确剖析借款人的信用评分、贷款价值比、地域分布等微观变量如何作用于逾期与违约概率,进而验证或修正经典的理论框架,如信息不对称理论下的逆向选择与道德风险模型。这不仅丰富了资产定价与风险管理领域的实证文献,也为监管机构评估证券化市场的系统性风险提供了坚实的微观证据基础。
衍生相关工作
该数据集的公开可用性已催生出多个衍生性的重要学术与开源工作。一些研究团队基于该数据开发了用于自动提取与解析SEC XML结构信息的工具链,极大提升了资产级数据的处理效率。另有工作专注于将此类贷款级数据与宏观经济指标进行联合分析,构建了可解释的机器学习模型,用以预测证券化资产池在不同利率周期下的压力表现。此外,围绕数据标准化与互操作性,部分研究者提出了统一的数据模式映射方案,旨在将不同信托的ABS-EE信息整合至通用的金融数据库,从而推动大规模实证研究与跨平台比较分析的发展。
以上内容由遇见数据集搜集并总结生成



