ConTSG-Bench

github2026-03-10 更新2026-03-07 收录

下载链接：

https://github.com/seqml/ConTSG-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

ConTSG-Bench是一个统一的基准测试，用于条件时间序列生成，包含10个基准数据集，涵盖多个领域，具有文本/属性/标签模态的对齐条件。

ConTSG-Bench is a unified benchmark for conditional time series generation. It includes 10 benchmark datasets covering multiple domains, which are equipped with aligned text, attribute and label modal conditions. The datasets encompass synthetic data and other types, with specific metadata such as domain, variables, sequence length and semantic level, among others.

创建时间：

2026-03-04

原始信息汇总

ConTSG-Bench 数据集概述

数据集基本信息

数据集名称：ConTSG-Bench
核心定位：首个用于条件时间序列生成的统一基准测试
主要目标：解决条件时间序列生成领域因条件模态（文本、属性、类别标签）和语义抽象层次（形态学与概念性）不同而导致的评估碎片化问题，提供系统性的比较框架。

数据集构成与特征

数据集数量：包含10个基准数据集。
覆盖领域：合成数据、能源、交通、环境、网络遥测、医疗（心电图）、气象学。
核心特征：每个数据集均提供对齐的多模态条件，即从相同底层语义衍生出的文本描述、结构化属性和类别标签，支持跨模态的受控比较。
数据维度：数据在条件类型上沿两个轴进行系统解耦：
1. 模态：类别标签、属性、文本。
2. 语义抽象层次：形态学（描述可观测的时间结构）与概念性（描述高层领域语义）。

详细数据集列表

数据集ID	领域	变量数	序列长度	语义层次
`synth-u`	合成	1	128	形态学
`synth-m`	合成	2	128	形态学
`ettm1`	能源	1	120	形态学
`istanbul_traffic`	交通	1	144	形态学
`airquality_beijing`	环境	6	24	形态学
`telecomts_segment`	网络遥测	2	128	形态学
`ptbxl_morphology`	医疗（心电图）	12	1000	形态学
`ptbxl_concept`	医疗（心电图）	12	1000	概念性
`weather_morphology`	气象学	10	36	形态学
`weather_concept`	气象学	10	36	概念性

数据获取与资源

数据集发布地址：https://huggingface.co/datasets/mldi-lab/ConTSG-Bench-Datasets
模型检查点发布地址：https://huggingface.co/mldi-lab/ConTSG-Bench-Checkpoints （当前公开范围：synth-u, synth-m）
交互式排行榜：https://huggingface.co/spaces/mldi-lab/ConTSG-Bench-Leaderboard

基准测试支持的模型

共支持11个代表性生成模型，涵盖所有三种条件模态：

文本条件模型（6个）：VerbalTS、T2S、BRIDGE、DiffuSETS、Text2Motion、Retrieval（基线）。
属性条件模型（3个）：TimeWeaver、WaveStitch、TEdit。
标签条件模型（2个）：TimeVQVAE、TTS-CGAN。

关键基准测试发现

生成保真度与条件遵循性是两个需要独立评估的维度。部分模型在两个维度上表现一致良好，而另一些则显示出显著的排名差异。
文本条件模型提供了最高的性能上限，但也具有最大的方差。文本条件模型的性能分布从顶部到底部，而属性条件方法则集中在中上游。

扩展性与社区

开放与演进：该基准测试是开放且不断演进的，欢迎社区提交新模型和数据集至排行榜。
易于扩展：采用基于装饰器的注册模式，支持轻松添加新模型和数据集。
提交指南：参见 docs/submission_guide.md。
基准范围维护：基准测试的范围（数据集/模型/指标）在 docs/benchmark_spec.md 中维护。

搜集汇总

数据集介绍

构建方式

在时序数据生成领域，条件生成模型因模态各异而难以横向比较。ConTSG-Bench通过整合十个跨领域数据集，构建了一个统一评估框架。这些数据集涵盖合成、能源、交通、环境、网络遥测、医疗心电图及气象等多个领域，每个数据集均经过精心设计，确保文本描述、结构化属性和类别标签三种条件模态在语义上严格对齐。数据集的构建遵循标准化流程，原始时序数据经过预处理后，分别提取形态学与概念性两个抽象层次的语义信息，并生成对应的多模态条件标注，从而为不同条件生成方法提供了可对照的评估基础。

使用方法

研究人员可通过简单的命令行接口快速使用该数据集进行模型训练与评估。安装配套软件包后，使用`contsg train`命令指定数据集与模型即可启动训练流程，系统支持从配置文件加载参数或从检查点恢复训练。评估阶段则通过`contsg evaluate`命令对训练好的模型进行多指标测评，涵盖生成保真度与条件遵从性等多个维度。数据集采用装饰器注册机制，允许用户便捷地扩展新的模型或数据集，仅需遵循既定接口与文件结构，即可将其纳入统一基准进行测试与排名。

背景与挑战

背景概述

在时间序列分析领域，条件生成技术正逐渐成为推动科学发现与工业应用的关键驱动力。ConTSG-Bench基准由上海科技大学的研究团队于2026年创建，旨在解决条件时间序列生成研究中长期存在的评估碎片化问题。该基准首次系统性地整合了文本、属性与类别标签等多种条件模态，并区分了形态学与概念性两种语义抽象层次，为生成模型在医疗、气候、交通等跨领域应用中的可控合成能力提供了统一的评估框架。其构建不仅促进了不同条件生成方法之间的公平比较，也为探索生成保真度与条件遵从性之间的平衡关系奠定了实证基础。

当前挑战

条件时间序列生成领域面临的核心挑战在于生成结果必须同时满足高保真度与严格的条件遵从性，而现有方法往往在这两个维度上表现失衡。具体而言，文本条件生成模型虽具备较高的性能上限，但其输出稳定性存在显著波动；属性条件方法则普遍集中于中上游水平，缺乏突破性表现。在数据集构建过程中，研究者需克服多模态条件对齐的复杂性，确保文本描述、结构化属性与类别标签在语义上的一致性，同时还需处理不同领域时间序列在变体数量、序列长度和语义层级上的异构性，以实现跨数据集的标准化评估。

常用场景

经典使用场景

在时间序列生成领域，ConTSG-Bench作为首个统一基准，其经典使用场景聚焦于系统评估多模态条件生成模型的性能。研究者可借助该基准，在涵盖合成数据、能源、交通、环境、医疗和气象等领域的十个数据集上，对文本、属性和类别标签三种条件模态进行标准化测试。通过统一的命令行接口和实验跟踪机制，用户能够高效比较不同模型在生成保真度与条件遵循度上的表现，从而推动可控时间序列生成技术的迭代与优化。

解决学术问题

该数据集解决了条件时间序列生成研究中的碎片化问题。以往工作因条件模态各异且评估标准不一，难以进行跨模型公平比较。ConTSG-Bench通过统一的条件模态（文本、属性、标签）和语义抽象层次（形态学与概念性）框架，为学术界提供了系统化的评估平台。它使得研究者能够深入探究不同条件形式对生成质量的影响，识别模型在条件遵循与数据真实性之间的权衡，从而促进了该领域方法论的科学进展与理论深化。

实际应用

在实际应用层面，ConTSG-Bench支撑了多个关键领域的仿真与合成需求。在医疗健康领域，它可用于生成符合特定病理描述的合成心电图数据，辅助诊断模型训练而不侵犯患者隐私；在气象预测中，能够基于概念性文本描述模拟极端天气事件的时间序列，提升气候模型的鲁棒性；在工业物联网场景下，可为网络流量或设备传感器数据生成符合指定属性条件的合成序列，用于系统压力测试或异常检测算法的开发，有效缓解真实数据稀缺或敏感的挑战。

数据集最近研究