DenyTranDFW/Toyota_Auto_Receivables_2022_D_Owner_Trust_1946790
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Toyota_Auto_Receivables_2022_D_Owner_Trust_1946790
下载链接
链接失效反馈官方服务:
资源简介:
该数据集涉及丰田汽车应收账款2022-D所有者信托(CIK 1946790)的SEC ABS-EE资产级别申报文件。内容包括申报文件数量(42个)、Parquet文件数量(69个)、总大小(187.9 MB)以及报告期(2022-09-30至2026-02-28)。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet格式组织。报告期日期来源于资产级别XML中的reportingPeriodEndingDate。
SEC ABS-EE asset-level filings for CIK 1946790 (Toyota Auto Receivables 2022-D Owner Trust). The dataset includes 42 filings, 69 parquet files, with a total size of 187.9 MB, covering the reporting period from 2022-09-30 to 2026-02-28. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍

构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,聚焦于丰田汽车应收款2022-D所有者信托(CIK 1946790)的资产层面数据。构建方式是通过系统性地提取该信托于2022年9月至2026年2月期间提交的42份ABS-EE申报文件中的XML附件,将每一份申报中蕴含的逐笔贷款或资产级别信息解析并转换为Parquet格式文件。最终形成69个Parquet文件,按照'存取编号(无横线)/附件名称.parquet'的层级结构进行组织,总数据量达187.9 MB。报告期间的具体日期则直接从资产级XML元数据中的'reportingPeriodEndingDate'字段精准获取,确保了时间序列的完整性与可追溯性。
使用方法
研究人员可通过直接加载Parquet格式文件高效处理该数据集,Parquet的列式存储特性尤其适合对大量贷款属性字段进行聚合与筛选分析。实际应用中,用户可依据'accessionNumber'字段关联不同报告期的申报文件,或利用'reportDate'字段构建时间序列模型,追踪诸如逾期率、提前偿付率及损失严重度等关键指标的变化趋势。数据集的标准化结构亦便于与Python、R或Julia等数据分析工具中的Pandas、DuckDB等库无缝集成,支持进行投资组合回测、信用风险评估及ABS现金流建模等复杂金融分析任务。
背景与挑战
背景概述
在资产证券化(ABS)领域,透明、标准化的资产级数据是评估资产池信用风险、进行估值建模以及监管合规的关键基石。Toyota Auto Receivables 2022-D Owner Trust数据集,由丰田汽车金融(Toyota Auto Finance)于2022年9月发起设立,旨在通过美国证券交易委员会(SEC)的ABS-EE(Asset-Level Electronic Data)规则,系统性地披露其汽车贷款资产池的逐笔贷款信息。该数据集涵盖了从2022年9月30日至2026年2月28日长达近三年的42份监管备案文件,共包含69个Parquet格式的资产级数据文件,总容量达187.9 MB。其核心研究问题聚焦于如何利用结构化的逐笔贷款数据,提升对丰田汽车ABS交易的信用风险量化能力与现金流预测精度,为金融科技、量化投资及监管科技领域提供了一个罕见的高质量、长序列的资产级样本库,对推动ABS市场的透明化与智能化定价具有深远影响。
当前挑战
该数据集所解决的领域挑战在于,传统的ABS市场长期受困于信息披露不充分、贷款池异质性强且缺乏标准化,导致投资者难以在个体贷款层面进行精细化风险评估与压力测试。具体而言,资产支持证券的复杂分层结构使得底层资产的违约相关性及提前偿付行为难以建模,而该数据集通过提供每个报告期末的完整贷款级快照,为破解这一“黑箱”难题提供了数据基础。在构建过程中,面临的主要挑战包括:如何从SEC EDGAR系统中海量的XML格式展品文件中,精确解析并提取包含数百个字段的逐笔贷款记录;如何跨多个备案文件版本(共42个)维护数据架构的一致性与时间序列的连续性;以及如何将原始的非结构化数据高效转换为开放且易于分析的Parquet列式存储格式,同时确保数据质量与完整性的严格校验。
常用场景
经典使用场景
在资产证券化研究领域,Toyota_Auto_Receivables_2022_D_Owner_Truest数据集是剖析汽车贷款ABS(资产支持证券)底层资产质量的经典样本。基于美国证券交易委员会SEC的ABS-EE强制性披露规则,该数据集提供了自2022年9月至2026年2月期间,每个报告月度末的逐笔贷款层面数据,涵盖约69个Parquet文件。研究者能够利用这些细粒度信息,对丰田汽车贷款池的借款人信用特征、贷款账龄分布、逾期率与提前偿付行为进行全景式建模,从而深刻理解结构化金融产品的内在风险传导机制。
解决学术问题
该数据集精准回应了学术界对信息不对称与资产池异质性两大核心议题的关切。通过揭示每笔贷款的还款进度与信用表现,它使得学者能够量化研究基础资产违约相关性对证券分层定价的冲击,弥补了传统聚合数据无法捕捉尾部风险的缺陷。此外,数据集独有的时序结构支持对抵押品预警信号的时间序列分析,为信用评级方法论的优化提供了实证基础,推动了监管机构对ABS信息披露标准有效性的评估与修订。
实际应用
在实际金融市场中,该数据集被资产管理公司与风险对冲机构用于构建久期匹配策略,例如依据历史提前偿付率调整证券投资组合的现金流预测模型。信用评级机构亦利用其逐笔贷款表现数据,校准压力情景下不同信用增级水平的损失覆盖率,从而为投资者提供更具韧性的评级意见。与此同时,智能风控平台可从中提取逾期模式特征,开发针对汽车贷款嵌套违约风险的机器学习预警系统,助力贷后管理的敏捷化与精细化。
数据集最近研究
最新研究方向
在资产证券化(ABS)领域,随着美国证券交易委员会(SEC)对ABS-EE(资产级数据)披露要求的深化,基于高频、细粒度资产池信息的量化分析成为前沿热点。该数据集涵盖丰田汽车应收款2022-D信托从2022年至2026年长达42个报告期的逐笔贷款数据,为研究者提供罕见的完整生命周期资产表现轨迹。当前研究聚焦于构建机器学习模型以预测提前偿付与违约风险,并利用时间序列分析探究宏观经济波动对汽车贷款池信用质量的影响。这一数据集的发布极大推动了结构化金融产品的透明度,使得投资者能够进行更精确的现金流建模与压力测试,同时也为监管机构评估系统性风险提供了实证基础,标志着ABS市场从静态披露向动态、数据驱动型风险管理的范式转变。
以上内容由遇见数据集搜集并总结生成



