Lemma-RCA-NEC/Cloud_Computing_Preprocessed
收藏Hugging Face2025-12-12 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/Lemma-RCA-NEC/Cloud_Computing_Preprocessed
下载链接
链接失效反馈官方服务:
资源简介:
云平台预处理的系统指标和日志数据集,用于时间序列预测。数据集包含从原始指标数据(Json格式)构建的指标时间序列(npy格式),以及从原始日志数据(Json格式)提取并解析为日志事件模板的日志消息。20240207的数据仅包含CloudTrail日志数据的CSV格式,无需预处理。
云平台预处理的系统指标和日志数据集,用于时间序列预测。数据集包含从原始指标数据(Json格式)构建的指标时间序列(npy格式),以及从原始日志数据(Json格式)提取并解析为日志事件模板的日志消息。20240207的数据仅包含CloudTrail日志数据的CSV格式,无需预处理。
提供机构:
Lemma-RCA-NEC
原始信息汇总
数据集描述
数据来源
预处理后的系统指标和日志数据来自云计算平台。
数据格式
- 从原始的Json格式指标数据构建了指标时间序列(npy格式)。
- 从原始的Json格式日志数据中提取了日志消息,并解析为日志事件模板。
特殊说明
20240207数据不包含EKS日志数据,仅包含CloudTrail日志数据(CSV格式),因此该数据集不需要使用日志解析器进行预处理。
引用
Lecheng Zheng, Zhengzhang Chen, Dongjie Wang, Chengyuan Deng, Reon Matsuoka, and Haifeng Chen: LEMMA-RCA: A Large Multi-modal Multi-domain Dataset for Root Cause Analysis. CoRR abs/2406.05375 (2024)
许可证
cc-by-nc-4.0: 非商业用途——您不能将数据用于商业目的。



