金融科技产品与机构多源数据集成库数据库
收藏国家基础学科公共科学数据中心2025-11-29 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6925d29c195d26651c431a36&type=1
下载链接
链接失效反馈官方服务:
资源简介:
在金融科技业务快速发展和风险管理精细化要求不断提高的背景下,多源异构数据的合规汇聚与高质量集成成为基础性问题。金融科技产品与机构多源数据集成数据库以生物识别远程身份认证、大数据驱动的金融欺诈识别和基于区块链的供应链金融为核心应用场景,在2023–2024年间系统采集并整合了上千家金融机构及其金融科技产品的真实业务样本,总数据规模为127.9GB。数据库采用“MySQL + MinIO”双引擎架构:利用MySQL存储机构、产品、模型与数据集等结构化信息,记录字段含义、时间戳和场景标签等元数据;利用MinIO对象存储管理人脸图像、指纹图像以及行为日志等非结构化数据,支持基于S3协议的高吞吐访问。数据在入库前统一经过脱敏、去标识化、重复记录剔除和字段标准化等处理,对机构与产品等关键表进行完整性与一致性检验,机构核心字段非空比例不低于99.7%,结构化机构表未发现重复记录。该数据适配MinIO-S3兼容环境,一次性复现“机构–产品–模型–数据集”的关联关系,为联邦学习、多方安全计算、跨机构风险传导分析以及监管沙盒测试等提供可重复、可扩展、可审计的基础数据支撑。
提供机构:
复旦大学



