five

Microservices Databases Dataset

收藏
arXiv2025-10-23 更新2025-11-05 收录
下载链接:
https://github.com/DatabaseEvolutionNudgeInMicroservices/daim
下载链接
链接失效反馈
官方服务:
资源简介:
Microservices Databases Dataset 是一个用于研究微服务架构中数据库使用情况的数据集。该数据集由 Namur 大学、USI 软件研究所和苏黎世大学的研究团队收集并发布,包含了 15 年间使用数据库的约 1005 个 GitHub 项目,涉及 14 类 180 种数据库技术。数据集内容涵盖了各种数据库类别和技术,包括关系型数据库、键值数据库、文档数据库、搜索引擎数据库等。该数据集旨在帮助研究人员和从业者更好地理解微服务架构中数据库的使用情况,并为未来的研究提供基准数据。
提供机构:
University of Namur,Belgium; REVEAL @Software Institute —USI,Lugano,Switzerland; University of Zurich,Switzerland
创建时间:
2025-10-23
搜集汇总
数据集介绍
main_image_url
构建方式
在微服务架构日益普及的背景下,该数据集通过系统化挖掘GitHub开源项目构建而成。研究团队采用多阶段筛选流程,从1.21亿个仓库中逐步过滤出1,005个符合微服务特征的项目。通过设定磁盘容量、星标数量、提交历史等六项严格标准,并结合Docker Compose文件分析与关键词匹配算法,最终形成涵盖15年发展历程的微服务数据库使用基准数据集。
特点
该数据集显著特征在于其全面覆盖14类数据库技术的实际应用场景,包含180种具体技术工具的使用记录。数据揭示出52%的微服务项目采用多数据库技术组合,其中关系型数据库仍占据主导地位(71.64%),同时键值型(42.09%)与文档型(25.77%)数据库也呈现广泛普及态势。特别值得关注的是数据集捕捉到了新兴技术如时序数据库、向量数据库等小众类别的实际应用案例。
使用方法
研究人员可通过该数据集深入探究微服务架构中数据库技术的组合模式与演化规律。具体操作时可基于Docker Compose声明文件解析技术栈构成,结合项目元数据(如创建时间、代码规模)分析技术选型与系统复杂度的关联。数据集支持通过数据库异质性指标量化技术多样性,并为研究多持久化策略、技术债务等课题提供实证基础。
背景与挑战
背景概述
微服务架构作为现代软件开发的核心范式,其兴起深刻重塑了数据管理策略。该数据集由Namur大学、卢加诺软件研究所及苏黎世大学的研究团队于2025年构建,聚焦微服务环境中数据库技术的实证研究。通过分析15年间约1000个GitHub项目,涵盖14类180种数据库技术,揭示了关系型、键值对、文档型及搜索引擎数据库的主导地位,以及52%系统采用多数据库类别的混合架构。该研究填补了微服务数据管理领域的实证空白,为架构师提供了技术选型的重要参考依据。
当前挑战
在解决微服务数据管理问题时,面临多数据库协同运作的复杂性挑战,包括数据一致性维护、跨库事务处理及异构数据模型整合。构建过程中需克服GitHub仓库识别困难,因微服务项目常缺乏明确架构标识,且存在单仓库与多仓库混合部署模式。此外,Docker镜像依赖筛选、项目活跃度验证以及架构特征自动化评分等环节,均对数据集的准确性与全面性构成严峻考验。
常用场景
经典使用场景
在微服务架构研究领域,该数据集为分析数据库技术选择与组合模式提供了重要实证基础。通过对1005个开源微服务项目的系统分析,揭示了关系型、键值、文档和搜索四类数据库的主导地位,其中52%的微服务采用多数据库技术组合策略。这种异构数据管理方式体现了微服务架构中数据自治与性能优化的核心需求,为理解实际开发中的技术决策提供了详实依据。
衍生相关工作
基于该数据集衍生的研究已拓展至多个方向:技术债务量化模型通过分析数据库组合复杂度预测系统维护成本;架构演化追踪研究利用时间维度数据揭示技术迁移规律;自动化配置工具通过学习常见技术组合模式生成优化部署方案。这些工作共同构建了微服务数据管理的方法论体系,推动了智能运维与架构重构技术的发展。
数据集最近研究
最新研究方向
在微服务架构日益普及的背景下,数据库管理范式正经历深刻变革。最新研究聚焦于多数据库技术的异构组合模式,实证分析显示52%的微服务项目采用两种以上数据库技术,形成以关系型、键值型、文档型和搜索引擎型数据库为核心的技术生态。研究揭示了系统复杂性与数据库数量间的正相关关系,并发现新兴项目正从传统关系型数据库向键值型与文档型技术迁移。针对特定场景的时序数据库、向量数据库等小众技术虽未广泛普及,但常与主流数据库形成互补组合,这种多持久化技术共存的实践为微服务数据自治与架构演化提供了新的研究视角。
相关研究论文
  • 1
    通过University of Namur,Belgium; REVEAL @Software Institute —USI,Lugano,Switzerland; University of Zurich,Switzerland · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作