five

DenyTranDFW/Benchmark_2024_V6_Mortgage_Trust_2012265

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/Benchmark_2024_V6_Mortgage_Trust_2012265
下载链接
链接失效反馈
官方服务:
资源简介:
SEC ABS-EE资产级别文件,针对CIK 2012265(Benchmark 2024-V6 Mortgage Trust)。包含4个文件,12个Parquet文件,总大小为3.2 MB,报告期为2024年4月11日至2024年7月11日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 2012265 (Benchmark 2024-V6 Mortgage Trust). Includes 4 filings, 12 Parquet files, total size of 3.2 MB, reporting period from 2024-04-11 to 2024-07-11. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦于美国证券交易委员会(SEC)的资产支持证券(ABS)电子化申报数据,专为CIK编号2012265的Benchmark 2024-V6 Mortgage Trust构建。通过提取ABS-EE表格中XML附件的贷款级或资产级原始信息,将数据整理为Parquet文件格式。数据集包含4份申报文件,每份文件按存取号(accession_nodash)与展品名称(exhibit_name)组织,最终生成12个Parquet文件,总容量达3.2 MB。申报时期跨度从2024年4月11日至2024年7月11日,其时间范围源自资产级XML中的reportingPeriodEndingDate字段。
特点
该数据集以高结构化与精细粒度著称,为资产证券化领域的专业分析提供了详实支撑。每项申报均附带SEC官方的访问编号、报告日期与链接,确保来源可追溯。数据以Parquet格式存储,兼具高效压缩与快速查询优势,适合大规模金融数据处理。此外,数据集统一采用GPL许可证,允许学术与商业场景下灵活使用。其资产级数据反映了抵押贷款池的逐笔动态,涵盖从发行初期到后续报告期内完整的时间序列。
使用方法
用户可通过Python的pandas库直接加载Parquet文件进行数据分析,例如使用pd.read_parquet()读取特定展品文件。如需整合多个文件,可依据存取号前缀与展品名称建立关联,构建跨期间的面板数据。数据集中的链接字段提供了指向SEC EDGAR系统的原始申报入口,便于交叉验证或扩充文本信息。对于需要批量处理的场景,可结合数据集清单中的元数据(如报告日期)进行过滤或索引,适配抵押贷款违约率建模、现金流预测等金融风控任务。
背景与挑战
背景概述
Benchmark_2024_V6_Mortgage_Trust数据集由美国证券交易委员会(SEC)的ABS-EE(资产支持证券-电子化)项目生成,专注于CIK编号2012265对应的Benchmark 2024-V6抵押贷款信托基金,创建于2024年,数据覆盖该信托基金在2024年4月至7月间的资产层面申报文件。该数据集核心研究问题在于通过提取XML附件中的贷款层面数据,以Parquet文件形式呈现,为资产支持证券市场提供透明化、细粒度的金融数据支持,助力风险评估与市场监管。其对相关领域的影响力体现在推动结构化金融数据标准化和可获取性,为学术研究、监管分析和投资决策提供坚实基础。
当前挑战
该数据集面临的挑战主要包括:首先,解决资产支持证券领域长期存在的透明度不足问题,通过提供贷款层面详细数据,使投资者和监管者能够深入评估抵押贷款池的信用风险与违约概率,克服传统汇总数据的局限性。其次,构建过程中遭遇XML附件格式复杂、数据提取难度高的技术挑战,需从非标准化电子文件中精准解析资产级信息,确保数据完整性与准确性。此外,数据量虽小但涉及多批次申报文件的时间对齐与一致性维护,以及SEC法规变动对数据采集标准的潜在影响,均对数据集构建和持续更新构成显著阻碍。
常用场景
经典使用场景
在资产证券化(ABS)领域,Benchmark_2024_V6_Mortgage_Trust_2012265数据集为金融科技与监管科技研究提供了珍贵的结构化资产级数据。该数据集源自美国证券交易委员会(SEC)的ABS-EE强制性电子申报系统,囊括了基准抵押贷款信托从2024年4月至7月期间的四期申报材料,拆解为12个Parquet格式文件。其核心价值在于将复杂的XML资产级申报表转化为可高效分析的列式存储,助力学者与从业者深入探究抵押贷款池的逐笔贷款特征,包括信用风险分布、现金流结构及资产组合动态,从而为风险评估模型与披露合规性研究奠定数据基石。
衍生相关工作
围绕Benchmark_2024_V6_Mortgage_Trust_2012265数据集,已经衍生出一系列前沿研究工作。部分工作聚焦于利用自然语言处理(NLP)技术,从SEC的XML文本中自动提取贷款条款与特殊条款,构建知识图谱以揭示资产池的隐含关联结构。另一些研究则结合时序分析与图神经网络,预测贷款池的累积损失曲线,并与信用违约互换(CDS)市场数据进行交叉验证。此外,该数据集还催生了针对ABS-EE申报标准化的比较研究,探讨不同信托主体在数据披露粒度与时效性上的异同,从而提出优化监管报告框架的建议,引领了金融数据治理领域的方法论革新。
数据集最近研究
最新研究方向
在资产证券化(ABS)领域,Benchmark_2024_V6_Mortgage_Trust数据集聚焦于SEC ABS-EE监管框架下的抵押贷款信托资产级数据标准化与透明度提升。2024年作为全球金融监管强化之年,该数据集涵盖了2024年4月至7月间的4次申报、12个Parquet文件,反映了前沿研究对底层贷款级风险敞口、现金流结构及偿付时序的细粒度剖析。此举呼应了后疫情时代抵押贷款市场对数据颗粒度与可审计性的迫切需求,为量化违约概率、构建压力测试模型及优化ABS评级体系提供了高时效性的标准化资产级信息库,尤其契合2024年美国抵押贷款利率波动与住房市场再定价等热点事件,推动学术界与实务界在结构化金融产品透明化研究上迈向新台阶。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作