five

CAShift Dataset

收藏
github2025-04-16 更新2025-04-20 收录
下载链接:
https://github.com/fish98/CAShift
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于基于日志的云攻击检测,特别是在常态变化下的基准测试。

This dataset is designed for log-based cloud attack detection, especially for benchmarking under normal state variations.
创建时间:
2025-04-06
原始信息汇总

CAShift数据集概述

数据集基本信息

  • 名称: CAShift: Benchmarking Log-Based Cloud Attack Detection under Normality Shift
  • 用途: 用于在常态变化下基于日志的云攻击检测基准测试
  • 包含内容:
    • 漏洞数据集
    • 系统日志收集框架
    • 提出的AE/VAE基线方法
  • 相关论文: "CAShift: Benchmarking Log-Based Cloud Attack Detection under Normality Shift" (FSE 2025)

数据集组成

  1. 数据集收集框架: CAShift Dataset Collection Framework
  2. 基准测试基线: CAShift Benchmarking Baselines

获取方式

社区贡献

  • 欢迎贡献包括但不限于:
    • 新增云应用程序
    • 引入新的攻击场景
    • 贡献额外的基线方法

引用格式

bibtex @article{yu2025cashift, title = {CAShift: Benchmarking Log-Based Cloud Attack Detection under Normality Shift}, author = {Yu, Jiongchi Yu and Xie, Xiaofei and Hu, Qiang and Zhang, Bowen and Zhao, Ziming and Lin, Yun and Ma, Lei and Feng, Ruitao and Liauw, Frank}, journal = {Proceedings of the ACM on Software Engineering}, year = {2025} volume = {X}, number = {FSE}, pages = {XXX-XXX}, publisher = {ACM New York, NY, USA} }

致谢

  • 感谢Ruozhao Yang对基于Web应用程序的漏洞利用PoC的支持
  • 感谢Jiahao Ying为基准测试实验提供的额外计算服务器
  • 研究部分由以下机构支持:
    • Lee Kong Chian Fellowship
    • 新加坡国家研究基金会
    • 网络安全局国家网络安全研发计划(NCRP25-P04-TAICeN)
搜集汇总
数据集介绍
main_image_url
构建方式
在云计算安全领域,CAShift数据集通过系统日志收集框架构建了一个全面的漏洞数据集,旨在评估常态偏移下的日志型云攻击检测能力。该数据集整合了多种云应用程序的真实运行日志,并模拟了多样化的攻击场景,确保数据覆盖广泛且贴近实际环境。研究人员采用自动化工具捕获系统行为,同时人工注入攻击模式,以平衡数据的真实性和可控性。
使用方法
使用者可通过在线共享平台直接获取预处理后的数据集,配套的框架代码支持从原始日志解析到特征提取的全流程操作。基准测试目录提供标准化评估脚本,用户仅需配置实验参数即可复现论文中的攻击检测实验。对于扩展研究,数据集收集框架允许集成新的云应用或攻击模式,社区贡献机制鼓励研究者共同完善该生态体系。
背景与挑战
背景概述
CAShift数据集由Jiongchi Yu等学者于2025年提出,旨在解决云计算环境中基于日志的攻击检测问题。该数据集由新加坡国立大学等机构联合开发,聚焦于常态偏移场景下的安全威胁识别,被收录于ACM软件工程国际会议(FSE 2025)。其创新性在于构建了包含漏洞数据集和系统日志采集框架的复合体系,为云安全领域提供了首个专门针对运行环境动态变化的基准测试平台,显著推进了自适应威胁检测算法的研究进程。
当前挑战
该数据集面临双重技术挑战:在领域问题层面,云环境中的常态偏移现象导致传统静态检测模型准确率骤降,需解决时序日志特征漂移与攻击模式隐匿性的耦合难题;在构建过程中,多源异构日志的标准化处理、真实攻击场景的仿真复现,以及对抗性样本的平衡生成构成主要障碍,研究者通过设计自动化采集框架和半合成数据生成策略予以应对。
常用场景
经典使用场景
在云计算安全领域,CAShift数据集为基于日志的云攻击检测提供了一个标准化的评估基准。该数据集通过模拟云环境中的多种攻击场景,并结合系统日志记录,为研究人员提供了一个丰富的实验平台。其经典使用场景包括训练和评估各种异常检测算法,特别是在处理正常性偏移(normality shift)情况下的攻击检测能力。通过使用该数据集,研究人员能够系统地比较不同方法的性能,从而推动云安全领域的算法创新。
解决学术问题
CAShift数据集解决了云安全研究中几个关键学术问题。首先,它填补了现有数据集中缺乏对正常性偏移情况下攻击检测能力评估的空白。其次,该数据集提供了多样化的攻击场景和相应的系统日志,使得研究人员能够深入研究不同类型攻击的特征和检测方法。此外,通过标准化的评估框架,该数据集促进了不同研究团队之间的结果可比性,为云安全领域的学术研究提供了坚实的基础。
实际应用
在实际应用中,CAShift数据集为云服务提供商和安全团队提供了宝贵的资源。通过利用该数据集训练的检测模型,企业能够更有效地识别云环境中的潜在攻击,从而提升整体安全性。该数据集还可用于安全产品的开发和测试,帮助厂商验证其解决方案在复杂云环境中的有效性。此外,数据集中的攻击场景和日志记录模式可以为安全运维团队提供参考,优化其监控和响应策略。
数据集最近研究
最新研究方向
随着云计算技术的广泛应用,云安全领域的研究日益受到重视。CAShift数据集作为基于日志的云攻击检测基准,专注于在常态偏移条件下评估检测模型的鲁棒性。该数据集不仅提供了丰富的漏洞数据和系统日志收集框架,还引入了先进的自动编码器(AE)和变分自动编码器(VAE)基线模型,为研究人员提供了标准化评估平台。当前研究热点集中在如何利用深度学习技术提升攻击检测的泛化能力,尤其是在云环境动态变化时的适应性。这一方向对于应对日益复杂的云安全威胁具有重要意义,相关成果已在FSE 2025等顶级学术会议上发表,推动了云安全领域的理论创新和实践应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作