five

DenyTranDFW/Toyota_Auto_Receivables_2023_A_Owner_Trust_1955778

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Toyota_Auto_Receivables_2023_A_Owner_Trust_1955778
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集涉及丰田汽车应收账款2023-A所有者信托(CIK 1955778)的SEC ABS-EE资产级别申报文件。内容包括申报文件数量、Parquet文件数量、总大小以及报告期。数据集包含从XML展品中提取的贷款级别/资产级别数据,并按特定格式组织。申报索引列出了所有申报文件的详细信息,如CIK、表格、登记号、报告日期和URL。

This dataset pertains to SEC ABS-EE asset-level filings for Toyota Auto Receivables 2023-A Owner Trust (CIK 1955778). It includes details on the number of filings, parquet files, total size, and the reporting period. The dataset contains loan-level/asset-level data extracted from XML exhibits, organized in a specific format. The filing index lists all the filings with their respective details such as CIK, form, accession number, report date, and URL.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,专门针对丰田汽车应收款2023-A所有者信托(CIK编号1955778)的资产层面数据。通过自动化流程,从SEC EDGAR数据库中提取了40份XML格式的资产层面申报文件,并将其转换为68个Parquet文件,总容量为177.4 MB。这些Parquet文件按照‘存取号无斜杠/展品名称.parquet’的目录结构组织,每个文件对应一个特定的申报展品。报告期起始于2022年12月31日,终止于2026年2月28日,覆盖了信托存续期间的完整月度数据。数据构建的核心是从XML中解析出每一笔贷款的详细信息,并利用`reportingPeriodEndingDate`字段提取报告周期日期,确保了时间序列数据的精确对齐。整个构建过程实现了从非结构化申报文本到结构化列式存储的高效转换,为后续的量化分析奠定了坚实基础。
特点
该数据集最显著的特征在于其高度的结构化和细粒度,提供了丰田汽车应收款信托下每一笔贷款的逐笔详细信息,而非汇总统计。数据以Parquet格式存储,这是一种高效的列式存储格式,特别适合于大规模数据集的快速读取和压缩存储,显著提升了数据处理效率。数据集包含了长达近四年的连续月度报告(从2022年末至2026年初),共计40份独立申报文件,形成了完整且可追溯的资产表现时间序列。每一份申报文件均通过唯一的`accessionNumber`进行标识,并附有对应的SEC EDGAR原始链接,确保了数据来源的权威性和可验证性。此外,数据集的标签明确指向SEC、ABS-EE和资产支持证券领域,体现了其高度的专业性和针对性,专为金融研究和结构化产品分析设计。
使用方法
使用该数据集时,研究者可直接加载Parquet文件进入数据处理环境,如Python的Pandas库或Apache Spark,进行高效的分析和建模。数据按时间序列组织,用户可通过`reportDate`字段筛选特定报告周期的贷款数据,或通过`accessionNumber`获取某一完整申报文件的所有记录。推荐将数据集与SEC EDGAR的原始XML文件结合使用,以获取更完整的上下文信息。对于资产支持证券研究,可基于贷款层面的借款人信用评分、贷款余额、利率、地域分布等字段构建违约预测模型或现金流分析模型。数据集的Parquet格式支持列剪裁和谓词下推,允许用户仅读取所需字段,极大优化了内存使用和查询速度。建议在分析前对数据质量进行初步审查,并利用报告基准日期(`reportingPeriodEndingDate`)确保时间序列的完整性。
背景与挑战
背景概述
该数据集源于2023年成立的丰田汽车应收款2023-A所有者信托(Toyota Auto Receivables 2023-A Owner Trust),由美国证券交易委员会(SEC)依据ABS-EE(资产支持证券电子化申报)框架发布。数据集由SEC的EDGAR系统收集,涵盖从2022年12月31日至2026年2月28日的40份申报文件,共计68个Parquet文件,总容量达177.4 MB。核心研究问题聚焦于汽车贷款资产支持证券(ABS)的资产层面数据透明化,为金融风险建模、资产池绩效分析和证券化市场监管提供细粒度信息。该数据集对资产证券化领域具有重要影响力,因其提供了标准化、机器可读的逐笔贷款数据,支持研究人员深入评估信用风险、提前偿付行为及现金流动态,进而推动金融科技与监管科技的发展。
当前挑战
数据集解决的核心领域挑战是汽车贷款ABS市场的信息不对称问题,传统上投资者和监管机构难以获取底层贷款的详细表现数据,限制了风险定价和违约预测的准确性。构建过程中面临的挑战包括:从非结构化XML附件中精确提取资产级数据,并统一为Parquet格式,涉及复杂的数据清洗与模式匹配;确保多份申报文件间数据一致性和完整性,跨越近四年的报告周期,应对不同时间段内数据字段的潜在变更;以及将40份独立申报文件整合为可查询的资产池时间序列,需处理日期对齐、缺失值填充和计算资源管理的难题。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,Toyota_Auto_Receivables_2023_A_Owner_Turst数据集为学者与从业者提供了详尽且规范化的资产层面数据,覆盖自2022年末至2026年初近四十个月的报告周期。该数据集的经典使用场景集中于结构化金融产品的风险建模与定价分析,尤其是针对汽车贷款抵押池的信用表现追踪。研究人员可借助其中逐笔贷款的付息、逾期及违约信息,构建动态池化模型,评估基础资产现金流的不确定性与早偿风险,进而深化对ABS分档结构内在特性的理解。
解决学术问题
该数据集有效解决了资产证券化研究中长期存在的微观数据缺失难题。传统学术工作多依赖于汇总层面的披露,难以捕捉单一贷款对整体证券化产品风险的边际贡献。借助此数据集,学者能够深入探讨抵押池异质性与信用评级之间的关联,验证结构性产品在压力情景下的脆弱性,并剖析贷款特征(如期限、利率、地域分布)与违约率之间的非线性关系。其影响在于提升了ABS风险评估的科学性与透明度,为监管政策的优化与金融稳定性的度量提供了坚实的实证基础。
衍生相关工作
围绕此类SEC ABS-EE披露数据集,学界与业界已衍生出一系列经典工作。例如,基于资产层面违约率的时间序列,研究者发展了针对汽车贷款ABS的生存分析模型,用以预测不同经济周期下各层级债券的预期损失。另有工作利用自然语言处理技术解析XML附表中的文本信息,构建了标准化抵押池画像,进而对比不同信托产品间资产筛选标准的差异。此外,该数据集亦被用于验证对抗性网络生成合成资产数据以辅助压力测试的可行性,拓宽了金融数据增强的研究边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作