five

NAB-Corpus

收藏
github2024-01-26 更新2024-05-31 收录
下载链接:
https://github.com/Nardeen-99/Time-Series-Anomaly-Detection-NAB-Corpus-
下载链接
链接失效反馈
官方服务:
资源简介:
NAB语料库包含58个时间序列数据文件,旨在为流式异常检测研究提供数据。该语料库由真实世界和人工生成的时间序列数据组成,包含标记的异常行为周期。数据按时间顺序排列,具有时间戳,是单一值的度量。除非另有说明,所有数据文件均包含异常。

The NAB Corpus contains 58 time-series data files, which are developed to provide data resources for streaming anomaly detection research. This corpus consists of both real-world and synthetically generated time-series data, with labeled periods of anomalous behavior. All data are arranged chronologically, equipped with timestamps, and represent single-value metrics. Unless otherwise specified, all data files contain anomalies.
创建时间:
2023-12-25
原始信息汇总

Time Series Anomaly Detection (NAB-Corpus)

数据集概述

  • 数据集名称: NAB corpus
  • 数据量: 58个时间序列数据文件
  • 数据类型: 包含真实世界和人工生成的时间序列数据,所有数据均为有序、带时间戳的单一值度量。
  • 异常标注: 数据文件中包含已标注的异常行为周期,除非特别说明,所有文件均包含异常。

数据来源

  • 主要来源: 来自多种真实世界数据源,如AWS服务器指标、Twitter流量、广告点击指标、交通数据等。
  • 特殊标注: 包含已知异常原因的数据,无手工标注。

具体数据文件

  • 文件名: ambient_temperature_system_failure.csv
  • 描述: 办公室环境温度数据。
搜集汇总
数据集介绍
main_image_url
构建方式
NAB-Corpus数据集的构建过程体现了对时间序列异常检测研究的深度支持。该数据集包含58个时间序列数据文件,涵盖了真实世界和人工生成的数据,每个文件均标注了异常行为的时间段。数据以有序、时间戳标记的单值指标形式呈现,确保了数据的时序性和一致性。数据来源广泛,包括AWS服务器指标、Twitter流量、广告点击量、交通数据等,确保了数据集的多样性和代表性。
使用方法
NAB-Corpus数据集的使用方法灵活多样,适用于多种时间序列异常检测算法的研究和验证。研究者可以通过分析数据集中的时间序列数据,识别和标注异常行为,进而开发和优化异常检测算法。数据集中的每个文件均提供了详细的时间戳和单值指标,便于研究者进行数据预处理和特征提取。此外,数据集的多样性和广泛性使其成为评估算法性能的理想选择。
背景与挑战
背景概述
NAB-Corpus数据集于2015年由Numenta公司发布,旨在为流式异常检测研究提供高质量的时间序列数据。该数据集由58个时间序列文件组成,涵盖了真实世界和人工生成的数据,并标注了异常行为的时间段。数据来源多样,包括AWS服务器指标、Twitter流量、广告点击指标和交通数据等。NAB-Corpus的发布为时间序列异常检测领域的研究提供了重要的基准数据,推动了该领域算法的发展与评估。
当前挑战
NAB-Corpus数据集在解决时间序列异常检测问题时面临多重挑战。首先,异常检测本身具有高度复杂性,尤其是在流式数据中,异常模式可能随时间动态变化,且与正常行为的界限模糊。其次,数据集中包含的异常类型多样,既有已知原因的异常,也有未知原因的异常,这增加了模型训练的难度。在构建过程中,研究人员需确保数据的多样性和代表性,同时还需精确标注异常时间段,这对数据收集和预处理提出了较高要求。此外,如何有效评估不同算法在真实场景中的表现,也是该数据集面临的重要挑战之一。
常用场景
经典使用场景
NAB-Corpus数据集在时间序列异常检测领域具有广泛的应用,特别是在流数据环境中。研究人员利用该数据集中的58个时间序列文件,能够有效地测试和验证各种异常检测算法的性能。这些数据涵盖了从AWS服务器指标到社交媒体流量等多种真实世界场景,为算法提供了丰富的实验环境。
解决学术问题
NAB-Corpus数据集解决了时间序列异常检测中的关键问题,即如何在复杂的流数据中准确识别异常行为。通过提供包含标记异常的真实和人工生成的时间序列数据,该数据集为研究人员提供了一个标准化的测试平台,有助于推动异常检测算法的创新和优化。
实际应用
在实际应用中,NAB-Corpus数据集被广泛应用于监控系统、网络安全和金融交易等领域。例如,企业可以利用该数据集中的AWS服务器指标数据,实时监控服务器性能,及时发现并处理潜在的系统故障,从而确保业务的连续性和稳定性。
数据集最近研究
最新研究方向
在时间序列异常检测领域,NAB-Corpus数据集因其丰富的真实世界和人工生成的时间序列数据而备受关注。该数据集不仅涵盖了AWS服务器指标、Twitter流量、广告点击量等多种来源,还提供了明确的异常行为标注,为研究者提供了宝贵的实验材料。近年来,随着物联网和大数据技术的迅猛发展,实时异常检测成为研究热点,NAB-Corpus在这一背景下显得尤为重要。研究者们利用该数据集开发了多种先进的异常检测算法,如基于深度学习的模型和集成学习方法,这些方法在提高检测精度和降低误报率方面取得了显著进展。NAB-Corpus的应用不仅推动了异常检测技术的创新,还为实际应用场景如服务器监控、社交媒体分析等提供了有力支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作