CAShift Dataset

github2025-04-16 更新2025-04-20 收录

下载链接：

https://github.com/fish98/CAShift

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于基于日志的云攻击检测，特别是在常态变化下的基准测试。

This dataset is designed for log-based cloud attack detection, especially for benchmarking under normal state variations.

创建时间：

2025-04-06

原始信息汇总

CAShift数据集概述

数据集基本信息

名称: CAShift: Benchmarking Log-Based Cloud Attack Detection under Normality Shift
用途: 用于在常态变化下基于日志的云攻击检测基准测试
包含内容:
- 漏洞数据集
- 系统日志收集框架
- 提出的AE/VAE基线方法
相关论文: "CAShift: Benchmarking Log-Based Cloud Attack Detection under Normality Shift" (FSE 2025)

数据集组成

数据集收集框架: CAShift Dataset Collection Framework
基准测试基线: CAShift Benchmarking Baselines

获取方式

直接访问: 共享在线驱动器

社区贡献

欢迎贡献包括但不限于:
- 新增云应用程序
- 引入新的攻击场景
- 贡献额外的基线方法

引用格式

bibtex @article{yu2025cashift, title = {CAShift: Benchmarking Log-Based Cloud Attack Detection under Normality Shift}, author = {Yu, Jiongchi Yu and Xie, Xiaofei and Hu, Qiang and Zhang, Bowen and Zhao, Ziming and Lin, Yun and Ma, Lei and Feng, Ruitao and Liauw, Frank}, journal = {Proceedings of the ACM on Software Engineering}, year = {2025} volume = {X}, number = {FSE}, pages = {XXX-XXX}, publisher = {ACM New York, NY, USA} }

致谢

感谢Ruozhao Yang对基于Web应用程序的漏洞利用PoC的支持
感谢Jiahao Ying为基准测试实验提供的额外计算服务器
研究部分由以下机构支持:
- Lee Kong Chian Fellowship
- 新加坡国家研究基金会
- 网络安全局国家网络安全研发计划(NCRP25-P04-TAICeN)

搜集汇总

数据集介绍

构建方式

在云计算安全领域，CAShift数据集通过系统日志收集框架构建了一个全面的漏洞数据集，旨在评估常态偏移下的日志型云攻击检测能力。该数据集整合了多种云应用程序的真实运行日志，并模拟了多样化的攻击场景，确保数据覆盖广泛且贴近实际环境。研究人员采用自动化工具捕获系统行为，同时人工注入攻击模式，以平衡数据的真实性和可控性。

使用方法

使用者可通过在线共享平台直接获取预处理后的数据集，配套的框架代码支持从原始日志解析到特征提取的全流程操作。基准测试目录提供标准化评估脚本，用户仅需配置实验参数即可复现论文中的攻击检测实验。对于扩展研究，数据集收集框架允许集成新的云应用或攻击模式，社区贡献机制鼓励研究者共同完善该生态体系。

背景与挑战

背景概述

CAShift数据集由Jiongchi Yu等学者于2025年提出，旨在解决云计算环境中基于日志的攻击检测问题。该数据集由新加坡国立大学等机构联合开发，聚焦于常态偏移场景下的安全威胁识别，被收录于ACM软件工程国际会议（FSE 2025）。其创新性在于构建了包含漏洞数据集和系统日志采集框架的复合体系，为云安全领域提供了首个专门针对运行环境动态变化的基准测试平台，显著推进了自适应威胁检测算法的研究进程。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，云环境中的常态偏移现象导致传统静态检测模型准确率骤降，需解决时序日志特征漂移与攻击模式隐匿性的耦合难题；在构建过程中，多源异构日志的标准化处理、真实攻击场景的仿真复现，以及对抗性样本的平衡生成构成主要障碍，研究者通过设计自动化采集框架和半合成数据生成策略予以应对。

常用场景

经典使用场景

在云计算安全领域，CAShift数据集为基于日志的云攻击检测提供了一个标准化的评估基准。该数据集通过模拟云环境中的多种攻击场景，并结合系统日志记录，为研究人员提供了一个丰富的实验平台。其经典使用场景包括训练和评估各种异常检测算法，特别是在处理正常性偏移（normality shift）情况下的攻击检测能力。通过使用该数据集，研究人员能够系统地比较不同方法的性能，从而推动云安全领域的算法创新。

解决学术问题

CAShift数据集解决了云安全研究中几个关键学术问题。首先，它填补了现有数据集中缺乏对正常性偏移情况下攻击检测能力评估的空白。其次，该数据集提供了多样化的攻击场景和相应的系统日志，使得研究人员能够深入研究不同类型攻击的特征和检测方法。此外，通过标准化的评估框架，该数据集促进了不同研究团队之间的结果可比性，为云安全领域的学术研究提供了坚实的基础。

实际应用

在实际应用中，CAShift数据集为云服务提供商和安全团队提供了宝贵的资源。通过利用该数据集训练的检测模型，企业能够更有效地识别云环境中的潜在攻击，从而提升整体安全性。该数据集还可用于安全产品的开发和测试，帮助厂商验证其解决方案在复杂云环境中的有效性。此外，数据集中的攻击场景和日志记录模式可以为安全运维团队提供参考，优化其监控和响应策略。

数据集最近研究