eDriveMORL
收藏eDriveMORL 数据集概述
数据集基本信息
- 名称: eDriveMORL
- 语言: 英语 (en)
- 标签: 代码 (code)
- 数据规模: 100K < n < 1M
- 配置:
- 默认配置 (default)
- 数据文件:
mpc_trajectories: minari_export/minari_MPC/data/dataset.jsonrule_trajectories: minari_export/minari_Rule/data/dataset.json
- 数据文件:
- 默认配置 (default)
数据集描述
eDriveMORL 是一个用于燃料电池电动汽车 (FCEV) 系统的离线强化学习基准套件,包含以下内容:
- 高保真 FCEV 动态模拟
- 兼容 Minari 的离线数据集
- 多个兼容 D3RLpy 的算法配置
- 自定义奖励函数和热模型
项目结构
. ├── run.py # 通过 CLI 运行所有算法的基准测试 ├── train.py # 从 Minari 生成离线数据集 ├── register_minari_dataset.py # 注册兼容 Minari 的 FCEV 数据集 ├── datasets/ # 存储生成的 D3RLpy HDF5 数据集 ├── requirements.txt # Python 依赖列表 ├── fcev/ # 核心模型实现 └── README.md # 当前文件
数据集内容
eDriveMORL 数据集通过 Minari 注册,包含从模拟 FCEV 模型中通过专家控制器 (如 MPC) 收集的状态-动作-奖励序列。
数据集字段
- 状态:
[SOC, T_fc, T_core, T_surf, speed, acc] - 动作:
[fc_ratio, cooling_level, coolant_split_ratio] - 奖励: 反映能量和热效率的自定义函数
- 终止: 情节结束或不可行性
使用步骤
-
注册 Minari 数据集 bash python register_minari_dataset.py
-
(可选) 重新生成离线数据集 bash python train.py
- 生成
.h5数据集存储在datasets/文件夹下
- 生成
-
运行离线 RL 基准测试 bash python run.py --algo CQL --dataset-path datasets/fcev-mpc-v1.h5 --drive-cycle CLTC-P-PartI.csv --n-steps 10000 --wandb-project fcev-offline-benchmark
可用算法
- TD3PlusBC
- IQL
- CQL
- BCQ
- CalQL
- AWAC
- ReBRAC
- TACR
- PLAS
- PRDC
- BEAR
日志与评估
- TensorBoard 日志:
tensorboard_logs/{algo} - 文件日志:
d3rlpy_logs/{algo} - WandB 指标 (可选): 在线查看实验仪表板




