five

DenyTranDFW/California_Republic_Funding_LLC_1561326

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DenyTranDFW/California_Republic_Funding_LLC_1561326
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含California Republic Funding LLC(CIK 1561326)的SEC ABS-EE资产级别文件。数据集包括4个文件,7个Parquet文件,总大小为3.9 MB,报告期从2016年12月31日至2018年5月31日。Parquet文件是从XML展品中提取的贷款级别/资产级别数据,按{accession_nodash}/{exhibit_name}.parquet组织。报告期日期来源于资产级别XML(reportingPeriodEndingDate)。

SEC ABS-EE asset-level filings for CIK 1561326 (California Republic Funding LLC). The dataset includes 4 filings, 7 Parquet files, with a total size of 3.9 MB, covering the reporting period from 2016-12-31 to 2018-05-31. Parquet files are loan-level / asset-level data extracted from XML exhibits, organised as {accession_nodash}/{exhibit_name}.parquet. Reporting-period dates are derived from the asset-level XML (reportingPeriodEndingDate).
提供机构:
DenyTranDFW
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国证券交易委员会(SEC)的ABS-EE(资产支持证券电子化)资产级申报文件,专注于CIK编号为1561326的California Republic Funding LLC实体。数据通过解析XML附件中的贷款级或资产级信息提取,并以Parquet格式存储。每条记录按accession编号去连字符后的目录组织,内含若干Parquet文件,文件名对应展品名称,报告期日期则直接取自XML中的reportingPeriodEndingDate字段。数据集共整合4次申报,生成7个Parquet文件,总占用存储空间约3.9 MB,覆盖从2016年12月31日至2018年5月31日的报告区间。
使用方法
用户可通过Hugging Face Datasets库直接加载该数据集,利用Python环境中的datasets.load_dataset函数即可实现快速接入。加载后的数据结构为包含资产级字段的表格形式,支持Pandas、PySpark等主流数据处理框架的进一步操作。对于特定展品或申报期的查询,用户可根据数据集提供的accession编号及展品名称进行过滤,亦可结合报告日期字段进行时间序列分析。鉴于数据源自SEC官方公开披露,使用时应遵循GPL许可协议,并注意对敏感金融信息的合规处理。
背景与挑战
背景概述
California Republic Funding LLC数据集由美国证券交易委员会(SEC)的ABS-EE(资产支持证券交易所电子化)档案体系生成,专注于收集CIK编号为1561326的实体在2016年至2018年期间的资产级贷款数据。该数据集涵盖4份申报文件、7个Parquet文件,共计3.9 MB,反映了资产支持证券领域中微观层面的贷款表现与风险特征。作为SEC推动金融市场透明度的重要成果,该数据集为研究资产证券化产品的信用风险、提前偿付行为及结构性金融产品的定价机制提供了关键的高频微观数据,推动了金融监管合规与量化分析领域的发展。
当前挑战
该数据集面临的核心挑战在于资产支持证券领域的贷款级数据稀疏性与时效性难题。所解决的领域问题包括:资产证券化产品底层资产异质性高,传统汇总数据难以捕捉单笔贷款的违约与提前偿付风险,需依赖精细的资产级信息进行建模。构建过程中遇到的主要挑战包括:XML文件格式复杂,不同申报期内的数据字段标准不一,需通过数据清洗与标准化处理消除歧义;同时,数据覆盖时间跨度仅约18个月,样本量有限,可能影响机器学习模型在长期风险预测中的泛化能力。
常用场景
经典使用场景
在资产支持证券(ABS)领域,该数据集为研究者提供了加州共和融资有限责任公司(California Republic Funding LLC)自2016年至2018年间提交的SEC ABS-EE资产层级申报数据。其核心价值在于以Parquet格式存储的逐笔贷款/资产级详细信息,这些数据源自XML展品,并按访问号和展品名称系统化组织。经典的使用场景包括构建结构化金融产品的信用风险模型,分析底层资产池的异质性特征,以及追踪资产绩效指标的时序演变,为证券化产品的定价与评级提供微观层面的实证基础。
解决学术问题
该数据集有效解决了金融研究领域中资产证券化微观数据匮乏的长期困境。学术界得以基于真实的贷款层级数据,深入探究资产池质量与违约风险的关联,验证信息不对称理论在结构化产品中的表现形式。其贡献在于揭示了报告期内资产表现的波动规律,为评估ABS产品的系统性风险积累、监管政策的有效性检验,以及优化证券化结构设计提供了前所未有的数据支撑,推动了金融经济学中资产定价与风险管理理论的实证发展。
实际应用
在实际金融业务中,该数据集的应用场景颇为广泛。投资机构可借助这些资产级历史数据,校准内部信用评估模型,优化投资组合的风险收益比。评级机构能够基于底层资产的现金流表现,更精准地评估ABS产品的信用等级,提升透明度。同时,监管机构可运用此数据集监控市场参与者的合规性,识别潜在的资产质量恶化趋势,防范系统性金融风险,从而维护金融市场的稳定与健康发展。
数据集最近研究
最新研究方向
California Republic Funding LLC数据集聚焦于资产支持证券(ABS)领域的微观层面,收录了2016至2018年间该实体向美国证券交易委员会(SEC)提交的ABS-EE表格中的资产级数据。随着全球金融监管对透明度的强化,尤其是次贷危机后对ABS底层资产风险的重新审视,该数据集为量化分析资产池的信用质量、现金流表现及违约模式提供了结构化样本。其前沿研究利用parquet格式的高效存储,可结合机器学习模型追溯特定时段内资产池的异质性分布,或与同期宏观经济指标联动,评估区域经济波动对ABS偿付能力的影响。这一方向呼应了SEC推动的资产级披露标准化趋势,为理解小型贷款机构的资产证券化行为与系统风险传导机制打开了新窗口。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作