What If TSF (WIT)
收藏arXiv2026-01-13 更新2026-01-15 收录
下载链接:
https://github.com/jinkwan1115/WhatIfTSF
下载链接
链接失效反馈官方服务:
资源简介:
What If TSF (WIT)是由首尔国立大学团队构建的多模态时间序列预测基准数据集,旨在评估模型在专家构建的未来情景文本引导下的预测能力。该数据集涵盖政治、社会、能源和经济四大领域,包含5,352条样本,每条样本整合了历史时间序列数据、静态领域描述及动态未来情景文本。数据来源于权威新闻媒体和机构报告,经过LLM辅助预处理和专家验证,确保文本与时间序列对齐且去标识化。其核心应用为解决传统预测方法无法利用外部文本语境的问题,支持短期/长期预测及反事实推理任务,为多模态时序分析提供严谨测试平台。
What If TSF (WIT) is a multimodal time series forecasting benchmark dataset constructed by the team from Seoul National University, which aims to evaluate the predictive performance of models when guided by expert-constructed future scenario texts. This dataset covers four core domains: politics, society, energy and economics, and contains 5,352 samples. Each sample integrates historical time series data, static domain descriptions and dynamic future scenario texts. The data is sourced from authoritative news media and institutional reports, and has undergone LLM-assisted preprocessing and expert validation to ensure that the texts are aligned with the corresponding time series and de-identified. Its core application is to address the limitation that traditional forecasting methods cannot leverage external textual context, supporting short-term/long-term forecasting and counterfactual reasoning tasks, and providing a rigorous testbed for multimodal time series analysis.
提供机构:
首尔国立大学·数据科学研究生院
创建时间:
2026-01-13
原始信息汇总
WhatIfTSF 数据集概述
数据集名称
WhatIfTSF
数据集核心描述
WhatIfTSF 是一个基准数据集,旨在将时间序列预测任务重新定义为一种由场景引导的多模态预测问题。
搜集汇总
数据集介绍

构建方式
在时间序列预测领域,传统方法多局限于历史数据的数值外推,而忽略了外部文本信息对预测的引导作用。What If TSF (WIT) 数据集的构建旨在弥补这一空白,通过整合专家知识驱动的未来情境,为多模态预测提供严谨的评估基准。其构建过程采用三阶段流程:首先从权威新闻机构与官方报告中收集原始文本与时间序列数据,确保信息来源的可靠性与时效性;随后利用大型语言模型进行预处理,包括去噪、实体去标识化以及文本与时间序列的动态对齐,以消除冗余信息与时间错位;最后通过领域专家验证,确保未来情境的合理性与逻辑一致性,并生成反事实情境以测试模型对情境变化的响应能力。
特点
WIT 数据集的核心特点在于其前瞻性情境引导机制,突破了现有基准中文本信息多局限于历史描述或静态变量的局限。该数据集覆盖政治、社会、能源与经济四大领域,共包含5352个样本,每个样本均包含时间序列数据、静态变量描述、历史背景文本以及专家构建的合理或反事实未来情境。其独特之处在于未来情境以条件性语言表述,避免直接揭示目标变量的未来方向,从而迫使模型依赖外部信息进行推理。此外,数据集通过严格的去标识化处理与时间对齐,有效降低了记忆风险与信息泄漏,确保了评估的公正性与挑战性。
使用方法
WIT 数据集主要用于评估模型在情境引导下的多模态预测能力,特别关注方向性预测的准确性。使用方法包括三个核心任务:短期预测任务要求模型基于历史数据与文本情境预测未来短期点的数值变化方向;长期预测任务侧重于在较长预测范围内评估方向性趋势;反事实预测任务则通过替换未来情境测试模型对情境变化的适应性与一致性。评估时,模型在零样本设置下接收时间序列与文本输入,输出方向性标签(上升、下降或不变),并以三向方向准确率作为主要评价指标。该设计使研究者能够系统检验模型是否真正利用了外部情境信息,而非仅依赖历史模式匹配。
背景与挑战
背景概述
时间序列预测在现实世界决策中扮演着关键角色,然而传统方法多局限于单一数值模态,依赖历史模式的外推。随着大语言模型在多模态融合方面展现出潜力,现有基准数据集往往提供回顾性或未对齐的原始文本,难以评估模型是否真正利用了文本输入。受人类专家结合历史证据与假设场景进行预测的实践启发,首尔国立大学数据科学研究生院的Jinkwan Jang、Hyunbin Jin等研究人员于2026年提出了What If TSF(WIT)数据集。该数据集旨在通过专家构建的合理或反事实未来场景,评估模型能否在文本上下文(尤其是未来情境)指导下进行条件预测,从而将预测重构为场景引导的多模态预测任务,为相关领域提供了更为严谨和实用的评估基准。
当前挑战
WIT数据集致力于解决多模态时间序列预测中的核心挑战:如何使模型有效利用外部文本信息(特别是未来导向的场景描述)进行条件预测,而非仅仅依赖历史数值模式。在构建过程中,研究团队面临多重挑战:一是确保文本上下文与时间序列在时间上精确对齐,避免信息泄露或错位;二是设计高质量、非冗余且信息丰富的未来场景描述,避免过度指定或提供静态重复信息;三是通过去标识化处理减少模型对特定实体名称的记忆风险,同时保留足够的领域线索以供推理。这些挑战共同指向了构建一个可靠、无噪声且能真实反映专家预测实践的多模态基准的复杂性。
常用场景
经典使用场景
在时间序列预测领域,传统方法通常局限于历史数值模式的简单外推,难以有效整合外部文本信息以应对复杂多变的现实场景。What If TSF (WIT) 数据集通过引入专家构建的未来情景文本,将预测任务重新定义为情景引导的多模态预测。其最经典的使用场景在于评估大型语言模型能否依据给定的未来情景(如政治事件、能源政策或经济展望)来调整对目标变量(如总统支持率、天然气价格)未来方向的预测。该数据集设计了短期、长期及反事实预测三种任务,要求模型在接收历史时间序列与结构化文本描述后,输出未来时段的变化方向(上升、下降或持平),从而系统检验模型对前瞻性信息的理解与利用能力。
衍生相关工作
WIT 数据集的提出,激发并支撑了一系列围绕情景感知与多模态融合的后续研究工作。在方法层面,它促进了如 ChronoSteer、Dual-Forecaster 等模型的发展,这些工作致力于更好地桥接时间序列基础模型与大型语言模型,或设计双分支架构以分别处理描述性文本与预测性文本。在评估框架上,WIT 对前瞻性情景的重视影响了后续基准的构建思路,例如对文本上下文进行更精细分类(如静态描述、历史对齐信息、未来干预)的工作。同时,其反事实预测任务的设计理念也被相关研究采纳,用于探究模型的可解释性与稳健性。此外,WIT 揭示的历史上下文预测信号有限而未来情景驱动性强的结论,也引导研究者重新审视多模态信息融合的策略,推动开发更专注于提取和推理未来相关信号的模型架构与训练范式。
数据集最近研究
最新研究方向
在时间序列预测领域,传统方法主要依赖历史数据的数值模式进行外推,难以有效整合外部文本信息以应对未来不确定性。WIT(What If TSF)数据集的提出,标志着多模态预测研究正从依赖历史描述转向以未来场景为导向的范式。该数据集通过提供专家构建的合理与反事实未来场景,为评估模型在文本引导下的条件预测能力设立了严谨基准。当前前沿研究聚焦于探索大型语言模型如何融合时序数据与场景文本,实现方向性预测,尤其在政治、社会、能源与经济等高风险领域,以模拟人类专家在不确定环境下的决策逻辑。这一方向不仅推动了多模态预测模型的解释性与可靠性发展,也为应对现实世界中复杂动态的系统提供了新的评估框架。
相关研究论文
- 1What If TSF: A Benchmark for Reframing Forecasting as Scenario-Guided Multimodal Forecasting首尔国立大学·数据科学研究生院 · 2026年
以上内容由遇见数据集搜集并总结生成



