DenyTranDFW/Toyota_Auto_Receivables_2025_C_Owner_Trust_2063142
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Toyota_Auto_Receivables_2025_C_Owner_Trust_2063142
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含丰田汽车应收账款2025-C所有者信托的SEC ABS-EE资产级备案数据。数据集包含11个备案文件,总大小为45.0 MB,报告期从2025年6月30日至2026年2月28日。数据以Parquet文件格式存储,是从XML展品中提取的贷款级/资产级数据。
SEC ABS-EE asset-level filings for CIK **2063142** (Toyota Auto Receivables 2025-C Owner Trust). The dataset includes 11 filings with a total size of 45.0 MB, covering the reporting period from 2025-06-30 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源于美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)制度,聚焦于丰田汽车应收款2025-C所有者信托(CIK编号2063142)。数据构建过程通过系统爬取SEC EDGAR系统,获取该信托自2025年6月30日至2026年2月28日期间提交的11份ABS-EE XML申报文件,并从中提取逐笔贷款或资产级别的明细数据。每份申报文件对应的XML附表中的资产级数据被清洗、解析并转化为Parquet格式,按访问编号(无连字符形式)和附表名称的组织层级存储为独立的Parquet文件,最终形成总计45.0 MB的结构化数据集。
特点
该数据集的核心优势在于其精细的资产级颗粒度与标准化格式。数据完整覆盖了丰田汽车应收款信托在约八个月报告期内的全部披露信息,包括每笔贷款的原始特征与表现状态。每个Parquet文件均蕴含从XML标签中提取的字段,其中报告期间终结日期直接从底层XML中解析,确保了时间维度的精确性。存储格式采用高性能列式Parquet,兼顾了数据压缩效率与分析查询速度,适合处理大规模金融数据集。此外,数据集索引提供了每个文件的CIK编号、表单类型、访问编号、报告日期及对应的SEC EDGAR链接,便于溯源与验证。
使用方法
使用该数据集时,推荐基于Python的数据分析生态,通过Pandas或Dask等库读取Parquet文件进行探索性分析。用户可根据Filing index中的元数据,按报告日期或访问编号筛选感兴趣的时间段或特定申报文件。每个Parquet文件对应一个特定的XML附表,加载后可利用数据框操作进行贷款层面的聚合统计、违约率计算或现金流建模。由于数据记录了多期报告的表现,适用于构建面板数据集,追踪同一资产池的时序变化。分析师可结合SEC官网链接核实原始披露,确保数据一致性与合规性。
背景与挑战
背景概述
Toyota Auto Receivables 2025-C Owner Trust 数据集由美国证券交易委员会(SEC)根据ABS-EE(Asset-Backed Securities Edgewise Exchange)框架发布,收录了丰田汽车应收款证券化信托在2025年6月至2026年2月期间的11份资产层面申报文件。该数据集聚焦于资产支持证券(ABS)的逐笔贷款级数据,旨在为金融监管与学术研究提供高度颗粒化的结构化信息。数据集由SEC监管要求下的标准化XML展品提取而来,总规模约45.0 MB,其构建标志着金融数据公开透明化的重要进展。研究团队或机构未明确提及,但数据来源依托于SEC的EDGAR系统,对资产证券化市场风险建模、投资者决策及监管合规分析具有基础性支撑作用。
当前挑战
该数据集面临的核心挑战包括:首先,资产支持证券领域长期受困于数据异构性与披露标准不统一,该数据集通过统一ABS-EE格式推动标准化,但解析非结构化XML过程中的语义映射偏差仍可能影响贷款级字段的准确性。其次,构建过程中需处理多份申报文件间时间跨度不一致(如2025年6月与7月报告间隙)及资产池动态更新导致的逻辑关联困难,例如单笔贷款在不同报告期的状态变更追踪。此外,数据集大小虽仅为45 MB,但金融数据的隐私合规要求对敏感字段的脱敏处理提出了额外挑战,需平衡可用性与法规约束。
常用场景
经典使用场景
Toyota Auto Receivables 2025-C Owner Trust数据集聚焦于资产支持证券(ABS)领域,尤其针对汽车贷款应收账款证券化产品。其经典使用场景在于为金融学术研究提供标准化的资产级(loan-level)微观数据,涵盖从2025年6月至2026年2月的逐月披露信息。研究者可基于该数据集中的XML衍生Parquet文件,深入剖析汽车ABS池内贷款的信用表现、提前偿付行为及违约风险动态,从而构建或验证结构性金融产品的定价与风险评估模型。此外,该数据集因来源于美国SEC的ABS-EE强制披露要求,具备高度的合规性与透明度,特别适合用于分析信息披露规则对市场效率的影响,以及比较不同信托结构下的资产池异质性特征。
解决学术问题
该数据集有效解决了资产证券化研究中长期存在的微观数据稀缺难题。过去,学者受限于聚合层面的数据,难以精确刻画贷款级别的信用迁移路径及贷款人行为模式。Toyota Auto Receivables 2025-C Owner Trust提供的逐笔贷款信息,使得研究者能够量化汽车ABS中借款人的偿付能力随时间演变的规律,并实证检验宏观经济波动(如利率调整或失业率变化)如何传导至底层资产池的违约率。其意义在于推动了结构性产品定价理论从依赖历史平均假设向数据驱动的精细化建模转变,同时为监管机构评估ABS信息披露的充分性与及时性提供了实证基础,从而促进金融市场的稳定与透明。
衍生相关工作
该数据集的衍生机理催生了多项经典学术工作。一方面,研究者常将其与同系列其他信托(如Toyota Auto Receivables 2024-B)的数据合并,构建跨时间维度的面板数据集,用以检验证券化市场中的逆向选择与道德风险假说。另一方面,基于该数据中报告的每月资产池状态,学者开发了基于机器学习的提前偿付预测模型,将贷款人特征(如信用评分、贷款期限)与宏观因素相结合,显著提升了预测精度。此外,部分工作聚焦于披露频率的实证效应——利用信托从月度到季度报告的差异,识别出披露间隔延长如何加剧市场信息不对称。这些研究不仅深化了对ABS市场运行机制的理解,也为SEC修订信息披露规则提供了理论依据。
以上内容由遇见数据集搜集并总结生成



