ETTm2, ETTh1, ETTh2, M4, Stock|时间序列预测数据集|时间序列数据数据集
收藏数据集概述
数据集下载
- 数据集可以从Google Drive下载,并解压到
datasets/
目录。
数据集使用
- 数据集用于时间序列预测实验,支持以下模型:
- TSMixer
- DLinear
- PatchTST
- TimesNet
实验示例
长期预测
- 例如,使用DLinear模型在ETTm2数据集上进行长度为96的预测: python python main.py --model DLinear --data ETTm2 --out_len 96 --in_len 336 --learning_rate 0.001 --batch_size 32 --individual "c"
零样本评估
- 例如,在ETTh1数据集上训练DLinear模型,并在ETTh2数据集上进行零样本测试: python python main.py --zero_shot_test True --data ETTh1 --test_data ETTh2 --model DLinear --out_len 96 --individual "c"
M4预测
- 在M4数据集中,输入长度和预测长度在
datasets/data_loader.py
中指定。训练DLinear模型: python python main_m4.py --model DLinear --data m4 --batch_size 32 --individual "c"
股票价格预测
- 在Stock数据集上训练DLinear模型,预测长度为7: python python main_stock.py --model DLinear --data stock --out_len 7 --in_len 28 --batch_size 128 --individual "c"
引用
-
如果使用此数据集,请引用相关论文:
@article{chen2024similarity, title={From Similarity to Superiority: Channel Clustering for Time Series Forecasting}, author={Chen, Jialin and Lenssen, Jan Eric and Feng, Aosong and Hu, Weihua and Fey, Matthias and Tassiulas, Leandros and Leskovec, Jure and Ying, Rex}, journal={arXiv preprint arXiv:2404.01340}, year={2024} }

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
koen430/relevant_selected_stock_news
该数据集包含通过GPT-3.5-turbo筛选出的新闻文章,旨在用于微调大型语言模型,以预测新闻发布后的股票价格变动。数据集包括多个特征,如股票代码、提示、文本、URL、结果、相关性、令牌计数等,并分为训练集、验证集和测试集。
hugging_face 收录