five

DenyTranDFW/Toyota_Auto_Receivables_2022_C_Owner_Trust_1933877

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Toyota_Auto_Receivables_2022_C_Owner_Trust_1933877
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集涉及丰田汽车应收账款2022-C所有者信托(CIK 1933877)的SEC ABS-EE资产级别备案。内容包括备案数量、Parquet文件数量、总大小以及报告期。数据集包含从XML展品中提取的贷款级别/资产级别数据,并按特定格式组织。备案索引列出了所有备案的详细信息,如CIK、表格、登记号、报告日期和URL。

SEC ABS-EE asset-level filings for CIK 1933877 (Toyota Auto Receivables 2022-C Owner Trust). The dataset includes details such as the number of filings, parquet files, total size, and the reporting period. It contains loan-level/asset-level data extracted from XML exhibits, organized in a specific format. The filing index lists all the filings with their respective details like CIK, form, accession number, report date, and URL.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
Toyota Auto Receivables 2022-C Owner Trust 数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化归档)系统,聚焦于CIK编号为1933877的丰田汽车应收账款信托实体。该数据集系统性地提取了该信托在2022年6月30日至2026年2月28日报告期间内提交的全部45份ABS-EE归档文件。构建过程中,每份归档中的XML附件被解析为贷款层面的资产级数据,并按照归档访问编号与附件名称的组织结构,生成了共计98个Parquet格式的数据库文件,总数据量达204.3 MB。报告期的起止日期精确来源于原始XML数据中的‘reportingPeriodEndingDate’字段,确保了时间信息的准确性与可追溯性。
特点
该数据集展现出卓越的结构化与精细化特征。所有数据均以高效的Parquet列式存储格式呈现,极大优化了大规模资产级数据的读取与查询效率。数据集的显著特点在于其资产层面的粒度,每一条记录均对应单个汽车贷款应收账款的详细属性,而非经过聚合的统计信息。跨越近四年的持续报告周期,使得研究者能够追踪同一资产池在不同时间节点的表现变化,为时序分析提供了坚实的数据基础。此外,紧密关联SEC官方EDGAR系统的每个归档链接,赋予了数据集高度的可验证性和监管合规背景。
使用方法
研究人员可通过Python的Pandas或Dask库直接加载Parquet文件,利用列式存储的优势进行高效的数据筛选与聚合操作。数据集按‘accession_nodash’和‘exhibit_name’的目录结构组织,方便按不同归档批次或特定附件进行定位。使用者可以根据‘reportingPeriodEndingDate’字段选择特定时间窗口的数据,开展如贷款违约率分析、提前还款行为建模或资产池信用质量演变研究等金融实证分析。数据集亦可与SEC EDGAR提供的其他结构化或非结构化信息进行关联,拓展研究深度,构建更为全面的资产支持证券分析框架。
背景与挑战
背景概述
资产支持证券(ABS)作为结构化金融产品的重要分支,其底层资产的质量与风险披露一直是监管与学术研究的焦点。Toyota Auto Receivables 2022-C Owner Trust数据集由SEC的ABS-EE(Asset-Backed Securities Exchange Electronic)系统收录,对应中央索引键(CIK)1933877,聚焦丰田汽车应收账款证券化交易。该数据集创建于2022年,由美国证券交易委员会(SEC)推动形成,旨在通过标准化的XML展品格式披露贷款级资产细节,涵盖自2022年6月至2026年2月的45份申报文件与98个Parquet文件,总规模达204.3 MB。核心研究问题在于如何利用高颗粒度资产数据解析汽车贷款组合的信用表现、提前偿付风险及现金流结构,为资产定价、风险建模与监管合规提供实证基础。其对固定收益研究、金融科技及监管科技领域的渗透意义深远,尤其推动了ABS二级市场的信息透明化进程。
当前挑战
该数据集所解决的领域问题核心在于数据非结构化与信息孤岛。传统ABS资产池数据常以PDF或非标准化文本文档形式存在,使得跨产品、跨时期的比较与建模难以实现,而该数据集通过统一XML模板将贷款级数据转化为机器可读的Parquet格式,显著提升了数据可操作性。构建过程中面临多重挑战:首先,需从45份SEC申报文件中精准提取并解析嵌套XML结构中的资产级变量,例如贷款余额、利率、地理分布与信用评分;其次,需确保不同报告期之间字段命名与数据类型的持续性,以维护时间序列分析的连贯性;此外,数据清洗环节需处理缺失值、异常贷款表现记录以及因交易终止或资产出售导致的截断数据问题,最终构建出标准化、可复用的分析基础,从而赋能汽车ABS市场的风险自评估与监管审查机制。
常用场景
经典使用场景
在全球资产证券化市场中,汽车贷款支持证券(ABS)因其资产池的高度分散性和稳定的现金流特征而备受关注。丰田汽车应收款2022-C所有者信托数据集正是这样一份典型的ABS-EE(资产支持证券增强型披露)资产级数据,它收录了自2022年6月至2026年2月期间,该信托向美国证券交易委员会(SEC)提交的全部45份ABS-EE申报文件及其98个Parquet格式的底层贷款级数据文件。这些经过结构化处理的数据源,为研究者构建贷款组合的微观行为模型提供了前所未有的精细化视角。经典的使用场景包括对汽车贷款提前偿付行为进行动态风险建模,剖析借款人信用特征与违约概率之间的非线性关联,以及运用生存分析方法刻画贷款的生命周期轨迹。此外,该数据还能支持对ABS分层(tranching)结构下不同层级证券的损失分布进行蒙特卡洛模拟,从而在时间序列与截面数据的交互中,验证理论上的现金流瀑布机制是否与实际运营数据相吻合。
衍生相关工作
围绕该数据集的衍生研究已催生出若干颇具影响力的学术与实践成果。在机器学习与金融科技交叠的领域,学者们构建了基于梯度提升树与Transformer架构的提前偿付预测模型,利用该数据的时序特性训练出能捕捉利率下降期再融资热潮的神经网络,显著优于传统PSA基准模型。在风险评估方向,有工作提炼了针对汽车ABS的“现金窗-流动性走廊”方法论,通过对比该信托不同报告期的资产币种与账户余额差,校准了Liquidity Coverage Ratio(LCR)框架下对担保债券的特殊处理方式。另有一系列论文借助该数据结构,探讨了零工经济模式下非传统收入证明借款人的信用表现,揭示了在合同条款约束下,第三方联合担保对风险缓释的真实效力。这些衍生工作不仅深化了对资产证券化微观结构的理解,还助力催生了融合自然语言处理与表格数据的下一代合规监管科技(RegTech)工具,为学术界与工业界搭建了从数据到洞见的桥梁。
数据集最近研究
最新研究方向
在资产支持证券(ABS)领域,Toyota Auto Receivables 2022-C Owner Trust 数据集为研究汽车贷款证券化市场的微观结构和风险动态提供了宝贵的结构化数据。该数据集收录了从2022年中至2026年初共计45份SEC ABS-EE合规文件,涵盖超过98个Parquet格式的逐笔贷款级信息,覆盖了丰田汽车金融在疫情后经济复苏阶段、利率波动周期及消费信贷环境变化时期的资产表现。研究者得以深入剖析贷款违约率、提前偿付行为与宏观经济指标之间的联动关系,进而构建更加精密的现金流模型和信用风险评估体系。这一数据集的出现顺应了美国SEC加强ABS透明度的监管趋势,推动了从传统评级依赖向数据驱动型资产定价范式的演进,对金融监管科技的发展和结构化产品的风险管理创新具有显著的理论与实践意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作