Time-IMM
收藏Time-IMM 数据集概述
数据集简介
Time-IMM 是一个不规则多模态多元时间序列数据集和基准测试集,作为 NeurIPS 2025 数据集与基准测试赛道提交的一部分发布。
数据集构成
- 完整基准测试包含九个数据集
- 由于 MIMIC-IV 的数据使用协议限制,无法重新分发其处理后的数据
- 提供预处理脚本和说明,帮助授权用户本地生成处理后的 MIMIC 数据
- 本次发布包含其他八个数据集
数据结构
所有数据集遵循统一结构以确保兼容性:
{数据集名称}/ └── processed/ └── {实体ID}/ ├── time_series.csv # 多元不规则时间序列数据 └── text.csv # 关联的非结构化文本数据
文件格式说明
time_series.csv 包含:
date_time:每个观测的时间戳record_id:实体唯一标识符(与文件夹名称匹配)- 其余列:对应多元时间序列数据的数值特征
text.csv 包含:
date_time:关联文本条目的时间戳record_id:实体唯一标识符- 最后一列:非结构化文本观察(如笔记、摘要、日志)
MIMIC 数据预处理
由于访问限制,原始 MIMIC 数据需要手动下载。请按照以下说明操作:
data/MIMIC/mimic_preprocess.ipynb
预处理将生成以下文件:
data/MIMIC/processed/{实体ID}/ ├── time_series.csv └── text.csv
引用信息
bibtex @inproceedings{ chang2025timeimm, title={Time-{IMM}: A Dataset and Benchmark for Irregular Multimodal Multivariate Time Series}, author={Ching Chang and Jeehyun Hwang and Yidan Shi and Haixin Wang and Wei Wang and Wen-Chih Peng and Tien-Fu Chen}, booktitle={The Thirty-ninth Annual Conference on Neural Information Processing Systems Datasets and Benchmarks Track}, year={2025}, url={https://openreview.net/forum?id=yeqrrn51TL} }




