five

DenyTranDFW/BANK_2022_BNK44_1950141

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/BANK_2022_BNK44_1950141
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国证券交易委员会(SEC)ABS-EE资产支持证券的资产级别申报文件,具体为CIK 1950141(BANK 2022-BNK44)的相关数据。数据集包含19个申报文件,共计38个Parquet文件,总大小为2.6 MB。报告期从2022年11月11日开始,至2024年5月13日结束。Parquet文件是从XML展品中提取的贷款级别或资产级别数据,按照{accession_nodash}/{exhibit_name}.parquet的格式组织,报告期日期来源于资产级别XML的reportingPeriodEndingDate字段。此外,数据集还提供了详细的申报索引表,包含CIK、表单类型、申报号、报告日期和URL等信息。

SEC ABS-EE asset-level filings for CIK **1950141** (BANK 2022-BNK44). The dataset includes 19 filings, 38 Parquet files, with a total size of 2.6 MB. The reporting period starts from 2022-11-11 and ends on 2024-05-13. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate). A detailed filing index is provided, including CIK, form type, accession number, report date, and URL.
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化申报)系统,专注于CIK编号为1950141的BANK 2022-BNK44资产支持证券项目。数据构建基于从19份XML展品中提取的贷款级或资产级信息,通过系统化的解析与转换,生成了38个Parquet文件,总容量为2.6 MB。每个文件以{accession_nodash}/{exhibit_name}.parquet的格式组织,直观反映了原始报送材料的层级关系。报告期自2022年11月11日起至2024年5月13日止,其中报告日期源自资产级XML字段reportingPeriodEndingDate,确保了时间戳的精准性与一致性。
特点
该数据集的核心特点在于其精细化的资产级数据粒度与标准化结构。Parquet格式的采用不仅大幅提升了数据压缩比与读写效率,还便于与大数据处理生态无缝对接。数据集完整覆盖了BANK 2022-BNK44项目自发行以来近一年半的月度申报记录,共计19个时间截面的动态信息,为投资者与分析师提供了追踪底层资产表现的时间序列基础。同时,每个文件与SEC原始备案号一一对应,确保了数据的可追溯性和审计合规性,在结构化金融研究领域具有较高的资料价值。
使用方法
在使用该数据集时,用户可直接通过加载Parquet文件进行数据探索与分析。借助Python中的pandas或PyArrow库,可高效读取38个文件并整合为统一的数据框架,进而对资产池的信用质量、现金流分布等指标开展量化研究。用户亦可依据 accessionNumber 或 reportDate 字段进行时间序列切片,聚焦特定报告期的资产状态。此外,通过链接至SEC官网的原始申报URL,可对数据进行交叉验证,满足严谨的学术研究或风险管理需求。
背景与挑战
背景概述
BANK_2022_BNK44_1950141数据集聚焦于资产支持证券(ABS)领域,由SEC(美国证券交易委员会)依据ABS-EE(Asset-Backed Securities Electronic Filing)规则发布,旨在通过标准化电子申报提升市场透明度。该数据集创建于2022年11月,由CIK编号1950141对应的发行人BANK 2022-BNK44提交,核心研究问题围绕资产层面数据的结构化提取与分析,涵盖贷款或资产池的逐笔细节。通过19份申报文件、38个Parquet文件(总容量2.6MB),数据集揭示了从2022年11月至2024年5月期间的资产表现动态,为金融风险建模、监管合规评估以及证券化产品定价提供了关键实证基础,对推动ABS市场的量化研究具有显著影响力。
当前挑战
当前数据集面临的挑战包括:其一,所解决的领域问题——在资产支持证券研究中,传统数据源往往缺乏标准化的逐笔资产细节,导致风险评估依赖宏观指标,而BANK_2022_BNK44数据集通过XML附件的结构化提取,实现了从报表日期到标的资产属性的精细化解构,但数据覆盖范围仅限于单一系列,难以推广至跨发行人或跨时期的比较分析;其二,构建过程中遭遇的数据解析与整合难题——原始XML附件格式多样且嵌套复杂,需经提取、清洗转换为Parquet格式,同时确保reportDate与reportingPeriodEndingDate的准确对应,而数据量虽小却隐含字段缺失或时间戳对齐的潜在误差,这对自动化处理流水线的鲁棒性提出了持续优化的要求。
常用场景
经典使用场景
在资产支持证券(ABS)研究领域,BANK_2022_BNK44_1950141数据集的核心价值在于提供了从SEC ABS-EE合规申报中提取的逐笔贷款级别和资产级别的详尽数据。该数据集收录了CIK编号为1950141的发行方(BANK 2022-BNK44)自2022年11月至2024年5月间的19份申报文件,涵盖了38个Parquet文件,总计约2.6 MB的结构化信息。研究者和分析师可借此深入剖析商业抵押贷款支持证券(CMBS)底层资产池的微观特征,包括贷款期限、利率分布、还款记录等关键指标,从而支持对证券化产品的信用风险评估、现金流建模以及资产池异质性分析,成为实证金融与结构化产品研究不可或缺的数据基石。
衍生相关工作
围绕该数据集已衍生出多项具有影响力的工作经验,其结构化格式(Parquet文件)与标准化元数据设计,为构建大规模ABS样本库奠定了技术模板。研究者常将其作为基准数据源,用于开发基于机器学习的贷款违约预测算法,例如利用贷款特征时间序列训练LSTM或XGBoost模型。同时,该数据集的公开路径与无许可协议(GPL)特性,催生了一批开源审计工具与可视化平台,使得自动提取ABS-EE申报关键信息并生成合规报告成为可能。此类衍生工作不仅复现了经典资产定价模型,也推动了可解释AI在金融监管科技中的融合创新,持续拓展结构化金融数据分析的边界。
数据集最近研究
最新研究方向
在资产支持证券(ABS)领域,BANK_2022_BNK44_1950141数据集的涌现为结构化金融产品的透明度与监管合规性研究注入了新动力。该数据集源自美国证券交易委员会(SEC)的ABS-EE强制披露规则,收纳了BANK 2022-BNK44从2022年11月至2024年5月的19份历史申报文件,涵盖38个Parquet格式的贷款层面数据。这些精细化的资产级信息,如贷款余额、利率与还款表现,正被前沿研究用于构建违约预测模型与现金流模拟算法,以评估商业抵押贷款支持证券(CMBS)的风险敞口。尤其在后疫情时代商业地产波动加剧的背景下,该数据集为学术界与监管机构提供了实时基准,助力于揭示底层资产池的异质性特征与信用迁移规律,推动ABS市场定价模型的范式革新。此外,其开放许可(gpl)特性也促进了跨机构合作研究,强化了数据驱动型金融监管的实践落地。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作