dynamicslab/KoopmanRL
收藏数据集卡片 for KoopmanRL
数据集描述
- 语言: code
- 许可证: cc-by-4.0
- 任务类别: reinforcement-learning
数据集概述
该数据集包含用于 Koopman-Assisted Reinforcement Learning 论文结果的实验数据,允许完全重现和进一步使用论文结果。
数据集结构
数据集包含约 461MB 的 Tensorboard 文件和保存的策略。
| 实验 | 大小 | 目的 |
|---|---|---|
| Episodic Returns | 161MB | 所有 5 种算法在 4 个环境中的情节回报 |
| Interpretability | 55MB | KoopmanRL 引入的可解释性检查 |
| AblationSKVIBatchSize | 3.4MB | 对所选批量大小的敏感性消融 |
| AblationSKVICompute | 21MB | 对用于构建 Koopman 张量的计算量的敏感性消融 |
| AblationSAKCMonoid | 86MB | 对用于构建字典的单子顺序的敏感性消融 |
| AblationSAKCCompute | 134MB | 对用于构建 Koopman 张量的计算量的敏感性消融 |
此外,还提供了已提取的数据框。所有实验都存储为 Tensorboard 文件,提取的情节回报存储在 .parquet.gz 数据框中,保存的策略存储在 .pt 文件中。
使用数据集
数据集可以通过 HuggingFace Datasets Library 轻松使用。
python from datasets import load_dataset
ds = load_dataset("dynamicslab/KoopmanRL")
或者下载数据集的特定部分
python from datasets import load_dataset
ds = load_dataset("dynamicslab/KoopmanRL", data_dir="data/EpisodicReturns")
许可证
整个数据集在 CC-BY-4.0 许可证 下授权。
联系信息
- Preston Rozwood (pwr36@cornell.com)
- Edward Mehrez (ejm322@cornell.edu)
- Ludger Paehler (paehlerludger@gmail.com)
- Steven L. Brunton (sbrunton@uw.edu)
如何引用
请按以下格式引用数据集
bibtex @misc{dynamicslab_2024, author={ {Dynamicslab} }, title={ KoopmanRL (Revision fcca4b3) }, year=2024, url={ https://huggingface.co/datasets/dynamicslab/KoopmanRL }, doi={ 10.57967/hf/1825 }, publisher={ Hugging Face } }
以及论文
bibtex @article{rozwood2024koopman, title={Koopman-Assisted Reinforcement Learning}, author={Rozwood, Preston and Mehrez, Edward and Paehler, Ludger and Sun, Wen and Brunton, Steven L.}, journal={arXiv preprint arXiv:tbd}, year={2024} }




