TSQA

Hugging Face2025-05-31 更新2025-06-01 收录

下载链接：

https://huggingface.co/datasets/Time-MQA/TSQA

下载链接

链接失效反馈

官方服务：

资源简介：

TSQA数据集是一个包含约200,000个问题回答对的大规模时间序列问题回答数据集，覆盖12个真实世界应用领域，支持预测、插值、异常检测、分类和开放性问题推理等多种时间序列任务，为大规模语言模型的开发和时间序列推理提供了丰富的资源。

创建时间：

2025-05-30

原始信息汇总

TSQA数据集概述

基本信息

许可证: Apache-2.0
任务类别: 问答、时间序列预测
语言: 英语
标签: 时间序列、时间序列问答、时间序列推理、开放式问题、时间序列分析
数据集名称: TSQA
规模: 100M<n<1B

简介

TSQA数据集是一个大规模的时间序列问答数据集，包含约200,000个问答对，覆盖12个现实应用领域和5种任务类型。

关键特性

多任务问答: 支持统一问答格式下的多样化时间序列任务
上下文增强: 整合辅助文本上下文以丰富推理
跨领域覆盖: 包含12个现实应用领域
大规模资源: 约200k问答对，远超现有数据集
开源模型: 提供预训练和微调的LLMs（Mistral 7B、Qwen-2.5 7B、Llama-3 8B等）

数据集详情

任务类型分布

任务类型	实例数量
预测	42,557
插值	38,657
异常检测	37,000
分类	37,000
开放式问答	37,629
总计	~200,000

领域分布

领域	示例
医疗健康	EEG, PPG, ECG
金融	广告
能源	电力、风能
物联网	传感器网络
环境	空气质量、降雨
自然	天气、生态
交通	交通流量
网络	网络流量
AIOps	云监控
人类活动	加速度计
机器传感器	工业日志
交通	异常检测

引用

@inproceedings{kong2025time, title={Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement}, author={Kong, Yaxuan and Yang, Yiyuan and Hwang, Yoontae and Du, Wenjie and Zohren, Stefan and Wang, Zhangyang and Jin, Ming and Wen, Qingsong}, booktitle={Proceedings of the 63nd Annual Meeting of the Association for Computational Linguistics}, year={2025} }

搜集汇总

数据集介绍

构建方式

TSQA数据集作为时间序列分析领域的重要资源，其构建过程充分考虑了多任务与跨领域的需求。研究团队从12个现实应用领域（如医疗健康、金融、能源等）收集了约20万组问答对，涵盖预测、填补、异常检测等五大任务类型。数据构建采用上下文增强技术，通过整合辅助文本信息提升推理深度，同时严格保证各领域样本的平衡性。构建过程中还特别设计了开放式推理问题，包含真伪判断、多项选择等多样化题型，为模型训练提供了丰富的语义场景。

使用方法

使用TSQA数据集时，研究者可通过HuggingFace平台直接加载预处理好的问答对。针对不同任务类型，建议采用分层抽样策略确保各领域数据均衡利用。对于预训练语言模型，可利用上下文描述字段进行指令微调；具体任务微调时，则可根据任务类型字段筛选相应子集。数据集中提供的元信息（如领域标签、问题类型）支持灵活的基准测试设计，用户既可进行全量数据训练，也能针对特定场景（如医疗时序分析）构建专项评估。官方提供的Mistral等预训练模型权重可加速模型迁移过程。

背景与挑战

背景概述

TSQA数据集是2025年由Kong Yaxuan等研究人员提出的大规模时间序列问答数据集，旨在推动时间序列分析与大语言模型融合的研究。该数据集由来自12个现实应用领域的约20万问答对构成，涵盖医疗健康、金融、能源、物联网等关键领域，并整合了预测、填补、异常检测、分类和开放式推理五大任务类型。作为首个统一时间序列多任务问答框架的资源，TSQA通过引入辅助文本上下文增强推理能力，为时间序列理解与多任务泛化研究提供了重要基准。其跨领域、多模态的特性显著拓展了传统时间序列分析的边界，对智能诊断、工业预测性维护等应用具有重要价值。

当前挑战

TSQA数据集面临的挑战主要体现在两个方面：在领域问题层面，时间序列问答需要解决非结构化时序数据与自然语言语义的复杂映射问题，特别是跨域特征提取、长周期模式关联以及多模态上下文融合等核心难题；在构建过程中，需克服真实场景数据异质性带来的标注困难，包括医疗等敏感领域的数据脱敏处理、多任务标签体系的一致性维护，以及开放式问题中主观判断与客观事实的平衡。此外，保持12个领域数据分布的均衡性，同时确保6种问答形式的逻辑严谨性，对数据集的质量控制提出了极高要求。

常用场景

经典使用场景

在时间序列分析领域，TSQA数据集因其多任务QA特性成为评估大型语言模型（LLMs）时间序列推理能力的黄金标准。研究者常利用其涵盖的12个应用领域和5类任务类型，对模型进行跨域泛化性能测试，特别是在医疗健康领域的EEG信号解析或金融领域的广告效果预测等场景中，模型需同时处理数值序列和辅助文本语境，展现出独特的复合推理能力。

解决学术问题

TSQA有效解决了时间序列分析中多任务联合建模的学术难题。通过统一的问题回答框架，该数据集首次实现了预测、插补、异常检测等传统任务的范式融合，尤其针对开放性问题中时序逻辑与常识推理的结合机制，为可解释性时序分析提供了基准平台。其规模远超同类资源的特点，显著缓解了时序领域数据稀缺对模型训练的制约。

实际应用

工业界将TSQA应用于智能运维（AIOps）系统的故障诊断模块开发，通过解析设备传感器日志中的异常模式，实现预测性维护。在环境监测领域，结合空气质量时序数据的开放性问题回答功能，支持环保部门进行污染溯源分析。金融科技公司则利用其广告效果预测任务优化实时竞价策略。

数据集最近研究