TimeSeriesGym
收藏TimeSeriesGym 数据集概述
数据集简介
TimeSeriesGym 是一个用于评估AI代理在时间序列机器学习工程挑战上的综合基准测试框架。当前版本包含:
- 34个挑战
- 23个独特数据源
- 8种不同时间序列问题
- 覆盖15个以上领域
核心功能
- 数据预处理和标注
- 模型选择和超参数调优
- 研究代码利用和改进
- 框架间代码迁移
- 特征工程和增强
系统要求
- Python: 3.9或更高
- 存储空间: 5-20GB(取决于比赛)
- 内存: 至少8GB RAM
- 网络: 数据集下载需要
- 依赖: 核心科学Python库(NumPy, Pandas, SciPy等)
安装与设置
基础安装
bash git clone https://github.com/your-org/timeseriesgym.git cd timeseriesgym pip install -e .
开发环境
bash pip install -e ".[dev]" pre-commit install
数据集准备
准备比赛数据集
bash
准备单个比赛
timeseriesgym prepare -c amp-parkinsons-disease-progression-prediction
准备所有比赛
timeseriesgym prepare -a
准备TimeSeriesGym-Lite(推荐入门集)
timeseriesgym prepare --lite
比赛评估
评估多个提交
bash timeseriesgym grade --submission submissions.jsonl --output-dir results/
评估单个提交
bash timeseriesgym grade-sample predictions.csv amp-parkinsons-disease-progression-prediction
比赛集
TimeSeriesGym-Lite
包含6个精选挑战,覆盖多个领域和问题类型:
amp-parkinsons-disease-progression-prediction context-is-key-moirai g2net-gravitational-wave-detection optiver-realized-volatility-prediction-hyperparameter-search ptb-xl-classification-challenge-feature-enhancement stomp-R-to-python
引用
bibtex @article{cai2025timeseriesgym, title={TimeSeriesGym: A Scalable Benchmark for(Time Series) Machine Learning Engineering Agents}, author={Cai, Yifu and Li, Xinyu and Goswami, Mononito and Wili{ }ski, Micha{l} and Welter, Gus and Dubrawski, Artur}, year={2025}, primaryClass={cs.CL}, }
许可证
MIT License




