five

Dataset B

收藏
github2024-08-26 更新2024-08-27 收录
下载链接:
https://github.com/eBay/LatentScope
下载链接
链接失效反馈
官方服务:
资源简介:
Dataset B 是一个用于KDD 24论文《通过潜在空间中的干预识别进行微服务根因分析》的数据集。它包含了度量数据和RCC列表,以及服务间的依赖关系,用于建立度量层的因果关系。

Dataset B is a dataset for the KDD 2024 paper titled "Root Cause Analysis of Microservices via Intervention Identification in Latent Space". It contains metric data, RCC lists, and inter-service dependencies, which are used to establish causal relationships at the metric layer.
创建时间:
2024-08-24
原始信息汇总

LatentScope 数据集概述

数据集描述

LatentScope 数据集是为 KDD 24 论文 "Microservice Root Cause Analysis With Limited Observability Through Intervention Recognition in the Latent Space" 提供的源代码和数据集 B。

数据集结构

  • 数据格式:数据集 B 包含在 data/dataset_b/data/1/ 目录下,具体格式包括 metrics.jsonrccs.json
  • 标签格式:服务依赖关系在 labels/service_deps.json 中指定,每个案例的触发器、根因和触发时间在 labels/label.json 中设置。

使用方法

  • 运行程序:使用 python main.py [--cpus NUM_WORKERS] 命令运行程序,结果将保存在 results/ 目录下。
  • 自定义数据集
    • 按照 data/dataset_b/data/1/metrics.jsondata/dataset_b/data/1/rccs.json 的格式组织数据。
    • data/[dataset_name]/data/[case_name]/ 目录下放置数据。
    • labels/service_deps.json 中指定服务依赖关系。
    • labels/label.json 中设置每个案例的触发器、根因和触发时间。
    • 如有需要,可在 utils.py 中添加指标类别确定代码。
    • 使用 python main.py -d [dataset_name] [--cpus NUM_WORKERS] 命令运行程序。

许可证

数据集遵循 Apache License Version 2.0 许可证。

搜集汇总
数据集介绍
main_image_url
构建方式
Dataset B的构建基于微服务系统的有限可观测性,通过干预识别在潜在空间中进行根因分析。数据集包含了多个微服务系统的性能指标和根因类别(RCC)列表,以及RCC之间的边和连接关系。这些数据通过特定的JSON格式组织,确保了数据的一致性和可解析性。此外,数据集还包含了服务间的依赖关系,这些关系在指标层面上建立了因果联系,从而为根因分析提供了坚实的基础。
使用方法
使用Dataset B时,用户首先需要下载包含数据集的代码库,并安装所需的依赖项。随后,用户可以通过运行`python main.py`脚本来执行分析任务,结果将自动保存至`results/`目录下。若用户希望使用自定义数据集,需按照`data/dataset_b/data/1/metrics.json`和`data/dataset_b/data/1/rccs.json`的格式组织数据,并在`labels/service_deps.json`中指定服务间的依赖关系。此外,用户还可以根据需要在`utils.py`中添加自定义的指标类别判定代码,以适应不同的数据集需求。
背景与挑战
背景概述
Dataset B,作为KDD 24会议论文《Microservice Root Cause Analysis With Limited Observability Through Intervention Recognition in the Latent Space》的核心数据集,由NetManAIOps实验室开发。该数据集聚焦于微服务系统的根因分析,通过在潜在空间中识别干预来解决有限可观测性下的问题。Dataset B的创建旨在为研究人员提供一个标准化的数据平台,以验证和改进微服务故障诊断算法。其主要研究人员和机构通过结合实际应用场景,构建了一个包含丰富元数据和因果关系的数据集,对微服务领域的研究具有重要推动作用。
当前挑战
Dataset B在构建过程中面临多重挑战。首先,微服务系统的高度动态性和复杂性使得数据收集和标注变得异常困难。其次,如何在有限的可观测性下准确识别和定位根因,是该数据集需要解决的核心问题。此外,数据集的通用性和可扩展性也是一个重要挑战,确保其能够适应不同微服务架构和故障模式的需求。最后,数据集的隐私和安全问题也不容忽视,如何在保障数据安全的前提下进行有效的研究和应用,是Dataset B需要持续关注的问题。
常用场景
经典使用场景
Dataset B 在微服务架构的根因分析中展现出其经典应用场景。通过识别潜在空间中的干预行为,该数据集能够有效解析微服务系统中的异常根源。具体而言,研究者可以利用 Dataset B 中的指标数据和 RCC(Root Cause Candidates)列表,结合服务间的依赖关系,构建因果图,从而实现对微服务故障的精准定位和分析。
解决学术问题
Dataset B 解决了微服务系统中根因分析的常见学术问题,特别是在有限可观测性条件下的故障定位。通过引入潜在空间干预识别技术,该数据集显著提升了根因分析的准确性和效率,为学术界提供了新的研究视角和方法论。其意义在于推动了微服务故障诊断技术的发展,并为相关领域的研究提供了宝贵的数据资源。
实际应用
在实际应用中,Dataset B 被广泛用于微服务系统的运维和故障管理。企业可以通过该数据集快速识别和定位微服务中的故障根源,从而缩短故障恢复时间,提高系统的稳定性和可靠性。此外,Dataset B 还支持自定义数据集的导入和分析,使其在不同业务场景中具有高度的灵活性和适用性。
数据集最近研究
最新研究方向
在微服务架构的复杂环境中,Dataset B 数据集的最新研究方向聚焦于通过干预识别技术在潜在空间中进行根因分析。这一研究方向不仅提升了在有限可观测性条件下的故障诊断精度,还为微服务系统的自动化运维提供了新的视角。通过构建和分析服务间的因果关系图,研究者们能够更有效地识别和定位系统中的异常根源,从而加速故障恢复过程。这一领域的进展对于提升现代分布式系统的可靠性和稳定性具有重要意义,尤其是在面对日益增长的系统复杂性和数据量时。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作