VisualTimeAnomaly

github2025-03-04 更新2025-03-05 收录

下载链接：

https://github.com/mllm-ts/VisualTimeAnomaly

下载链接

链接失效反馈

官方服务：

资源简介：

一个包含12.4k时间序列图像的大规模数据集，用于多模态大型语言模型在时间序列异常检测中的研究和基准测试。

A large-scale dataset comprising 12.4k time-series images, designed for research and benchmarking of multimodal large language models on time-series anomaly detection tasks.

创建时间：

2025-02-20

原始信息汇总

VisualTimeAnomaly 数据集概述

数据集简介

VisualTimeAnomaly 数据集是用于研究多模态大型语言模型（MLLMs）在时间序列异常检测（TSAD）中的性能的官方数据集。该数据集与论文 "Can Multimodal LLMs Perform Time Series Anomaly Detection?" 相关。

数据集贡献

提供了首个针对多模态大型语言模型在时间序列异常检测的全面基准测试，涵盖了多种场景（单变量、多变量、不规则时间序列）和不同异常粒度（点级、范围级、变量级）。
提供了几个关键见解，显著推进了对于多模态大型语言模型和时间序列异常检测的理解。
构建了一个大规模数据集，包含12.4k个时间序列图像，并公开发布了数据集和代码以促进未来的研究。

数据集发现

多模态大型语言模型在检测范围级和变量级异常方面比点级异常更有效。
多模态大型语言模型对不规则时间序列具有高度鲁棒性，即使数据缺失25%也能保持性能。
开源多模态大型语言模型在时间序列异常检测中的表现与专有模型相当，尤其在单变量时间序列上表现出色，而专有模型在多变量时间序列上表现更佳。

引用信息

@article{xu2025can, title={Can Multimodal LLMs Perform Time Series Anomaly Detection?}, author={Xu, Xiongxiao and Wang, Haoran and Liang, Yueqing and Yu, Philip S and Zhao, Yue and Shu, Kai}, journal={arXiv preprint arXiv:2502.17812}, year={2025} }

搜集汇总

数据集介绍

构建方式

本研究团队构建了VisualTimeAnomaly数据集，旨在为时间序列异常检测任务提供一种全新的多模态大规模数据集。该数据集的构建采用了12.4万张时间序列图像，涵盖单变量、多变量以及不规则时间序列，以适应不同场景和异常粒度的需求。

特点

VisualTimeAnomaly数据集的特点在于其全面性与创新性。它不仅为多模态大型语言模型在时间序列异常检测领域提供了首个全面的基准，而且包含的场景多样，异常类型丰富，为研究者提供了广泛的实验平台。此外，该数据集的构建还提供了对多模态大型语言模型和时间序列异常检测的深入见解。

使用方法

用户可通过访问数据集的GitHub页面获取数据集及使用说明。数据集的使用涉及对时间序列图像的识别与分析，旨在评估多模态大型语言模型在时间序列异常检测中的性能。用户需遵循相关数据使用规定，并在研究成果中引用原始论文，以促进学术交流与合作。

背景与挑战

背景概述

VisualTimeAnomaly数据集，作为时间序列异常检测领域的一项创新性成果，由Xu, Xiongxiao等研究人员于2025年提出。该数据集旨在评估多模态大型语言模型在时间序列异常检测任务上的表现，涵盖了单变量、多变量和不规则时间序列等多种场景，以及不同粒度的异常检测。VisualTimeAnomaly的构建，不仅为相关领域提供了一个全面基准，而且通过其大规模的数据集和开源代码，促进了未来研究的深入开展。

当前挑战

在构建VisualTimeAnomaly数据集的过程中，研究人员面临了多方面的挑战。首先，如何确保多模态大型语言模型在处理不同类型和粒度的时间序列数据时具有高效性和准确性，是一个关键问题。其次，构建一个包含12.4k时间序列图像的大规模数据集，并保证数据的多样性和质量，也是一项艰巨的任务。此外，数据集在涵盖广泛场景的同时，还需解决开源模型与专有模型在时间序列异常检测中的性能比较问题，以及模型对于数据缺失的鲁棒性问题。

常用场景

经典使用场景

在时间序列异常检测领域，VisualTimeAnomaly数据集的典型应用场景在于评估和验证多模态大型语言模型在处理时间序列数据上的性能。该数据集提供了一个全面的基准，通过包含不同场景（单变量、多变量、不规则时间序列）和不同异常粒度（点级、范围级、变量级）的数据，研究人员可以利用这一数据集对模型进行深入的训练和测试，以期提升模型在时间序列异常检测任务上的准确性和鲁棒性。

解决学术问题

VisualTimeAnomaly数据集解决了传统时间序列异常检测方法中存在的局限性，如难以处理不规则时间序列数据和不同类型的异常。它为学术界提供了一个大规模、多样化的数据集，有助于研究人员探索和解决如何利用多模态大型语言模型进行有效的时间序列异常检测这一学术难题，对推动该领域的研究具有重要意义。

衍生相关工作

基于VisualTimeAnomaly数据集的研究成果，已经衍生出一系列相关工作，包括但不限于对多模态大型语言模型在时间序列异常检测中的性能优化、异常检测算法的创新以及跨领域数据集的构建。这些研究进一步扩展了该数据集的应用范围，并促进了相关技术的进步和学术讨论的深入。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集