FluidGym
收藏arXiv2026-01-21 更新2026-01-23 收录
下载链接:
https://github.com/safe-autonomous-systems/fluidgym
下载链接
链接失效反馈官方服务:
资源简介:
FluidGym是由多特蒙德工业大学和慕尼黑工业大学联合开发的首个独立、完全可微分的强化学习基准测试套件,专注于主动流控制领域。该数据集基于PyTorch实现,集成GPU加速的PICT求解器,无需依赖外部CFD软件,提供标准化评估协议。其包含多样化的环境配置,支持单智能体和多智能体设置,涵盖2D和3D场景,旨在解决流控制中的高维非线性和可扩展性问题。通过16k GPU小时的实验验证,该数据集为基于学习的流控制研究提供了系统化比较和可复现基础。
FluidGym is the first standalone, fully differentiable reinforcement learning benchmark suite co-developed by the Technical University of Dortmund and the Technical University of Munich, focusing on the field of active flow control. Implemented based on PyTorch, it integrates a GPU-accelerated PICT solver, eliminates the need for external CFD software, and provides standardized evaluation protocols. It features diverse environment configurations, supports both single-agent and multi-agent settings, covers 2D and 3D scenarios, and aims to address the challenges of high-dimensional nonlinearity and scalability in flow control. Validated via 16,000 GPU hours of experiments, this benchmark suite provides a systematic comparison and reproducible foundation for learning-based flow control research.
提供机构:
多特蒙德工业大学; 拉马尔机器学习与人工智能研究所; 慕尼黑工业大学
创建时间:
2026-01-21
原始信息汇总
FluidGym 数据集概述
数据集基本信息
- 数据集名称: FluidGym
- 维护者/机构: safe-autonomous-systems
- 许可证: MIT
- 编程语言: Python
- 主要依赖: PyTorch 2.9, CUDA 12.8
- 支持的Python版本: 3.10, 3.11, 3.12, 3.13
数据集描述
FluidGym 是一个用于大规模流动控制的强化学习算法基准测试环境。它提供了一个类似 gymnasium 的接口,旨在促进强化学习算法在计算流体动力学领域的应用和评估。
核心功能与特性
- 提供标准化的强化学习环境接口。
- 包含预定义的流动控制场景,例如
JetCylinder2D-easy-v0。 - 支持环境重置、动作采样、状态步进和渲染等标准操作。
安装方式
通过 PyPi 安装
-
安装兼容 CUDA 12.8 的 PyTorch: bash pip install torch --index-url https://download.pytorch.org/whl/cu128
-
安装 FluidGym: bash pip install fluidgym
使用 Docker 容器
提供两种容器:
- 运行环境:
becktepe/fluidgym-runtime - 开发环境:
becktepe/fluidgym-devel启动命令: bash docker run -it --gpus all fluidgym-runtime bash docker run -it --gpus all fluidgym-devel bash
从源码构建
- 创建并激活 Conda 环境。
- 安装 gcc。
- 安装 PyTorch for CUDA 12.8。
- 安装匹配的 CUDA 工具包。
- 克隆仓库并执行
make install进行编译和安装。
快速开始
- 参考官方文档:https://safe-autonomous-systems.github.io/fluidgym/
- 参考
examples目录中的示例。 - 基本使用模式:
python
import fluidgym
env = fluidgym.make("JetCylinder2D-easy-v0")
obs, info = env.reset(seed=42)
... 交互循环
引用
如果使用本数据集,请引用: bibtex @misc{becktepe-fluidgym26, title={Plug-and-Play Benchmarking of Reinforcement Learning Algorithms for Large-Scale Flow Control}, author={Jannis Becktepe and Aleksandra Franz and Nils Thuerey and Sebastian Peitz}, year={2026}, eprint={2601.15015}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2601.15015}, note={GitHub: https://github.com/safe-autonomous-systems/fluidgym}, }
搜集汇总
数据集介绍

构建方式
在流体控制领域,传统基准测试常依赖外部计算流体动力学(CFD)求解器,导致软件堆栈复杂且难以统一评估。FluidGym通过集成GPU加速的PICT求解器与PyTorch框架,构建了一个完全可微、独立运行的基准测试套件。该数据集采用模块化设计,将CFD模拟与控制接口统一于单一Python包中,无需外部CFD软件或耦合层。环境配置涵盖二维与三维流场,包括圆柱绕流、瑞利-贝纳德对流、翼型绕流和湍流通道流等经典场景,每个场景均提供三个难度级别,并通过标准化奖励函数、观测空间和动作空间确保评估的一致性。
特点
FluidGym的突出特点在于其端到端的可微性,允许梯度通过整个模拟流程反向传播,从而支持基于梯度的控制方法与经典强化学习算法的无缝结合。数据集原生支持单智能体与多智能体强化学习设置,能够模拟分布式执行器的协同控制。此外,所有环境均基于高性能GPU计算实现,运行效率显著提升,并提供了预分割的训练、验证和测试集,包含随机生成的初始条件,确保了实验的可重复性与统计稳健性。
使用方法
研究人员可通过pip直接安装FluidGym,并利用Gymnasium或PettingZoo等标准强化学习接口进行实验。数据集支持三种交互模式:单智能体强化学习、多智能体强化学习以及基于梯度的控制方法。用户可调用预置的环境类,通过reset()和step()函数与环境交互,并使用Stable-Baselines3或TorchRL等算法框架训练策略。数据集中已包含基于PPO和SAC的基线结果,所有训练模型与模拟数据均已公开,便于进行算法比较与迁移学习研究。
背景与挑战
背景概述
流体主动控制领域长期面临高维非线性系统的控制策略设计难题,强化学习技术为解决此类问题提供了崭新路径。FluidGym数据集由德国多特蒙德大学与慕尼黑工业大学的研究团队于2026年联合推出,旨在构建首个独立、全可微的强化学习基准测试套件。该数据集通过集成GPU加速的PICT求解器与PyTorch框架,实现了计算流体动力学仿真与强化学习算法的无缝对接,有效解决了以往研究中因异构观测方案、数值设置与评估协议导致的进展评估困难问题。其核心研究目标在于为大规模流场控制建立标准化、可复现的实验平台,推动基于学习的流体控制方法向三维场景与多智能体协同控制拓展,对航空航天、能源采集等工程领域具有深远影响。
当前挑战
FluidGym数据集致力于解决流体主动控制中强化学习算法评估标准不统一的根本挑战。传统研究因依赖外部CFD求解器、缺乏全场景可微性支持、三维与多智能体控制能力有限,导致算法性能难以横向比较。在数据集构建过程中,研发团队需要攻克多重技术壁垒:首先需设计完全基于PyTorch的自主求解器架构,避免外部软件依赖造成的安装复杂性与计算断层;其次要实现从二维到三维流场仿真的梯度可微性传递,确保端到端优化路径的完整性;此外还需建立涵盖圆柱绕流、瑞利-贝纳德对流、翼型绕流与湍流通道等典型场景的标准化任务定义,并在保持物理真实性的前提下平衡计算效率与仿真精度。
常用场景
经典使用场景
在流体控制领域,FluidGym数据集为强化学习算法的标准化评估提供了经典平台。该数据集通过集成GPU加速的PICT求解器与PyTorch框架,构建了完全可微分的仿真环境,覆盖圆柱绕流、瑞利-贝纳德对流、翼型绕流和湍流通道流等典型流体场景。研究者可利用其统一的观测、动作与奖励接口,在单智能体与多智能体配置下系统比较PPO、SAC等算法的控制性能,同时支持从二维到三维、从低湍流度到高湍流度的难度递进实验,为流场主动控制研究建立了可复现的基准测试体系。
衍生相关工作
FluidGym的发布推动了流体控制与机器学习交叉领域的一系列衍生研究。其构建的标准化环境促进了DRLinFluids、drlFoam等早期基准的升级迭代,并启发了HydroGym等后续平台对可微分性与多智能体支持的强化。基于该数据集开展的策略迁移研究,揭示了二维到三维、小尺度到大尺度流场控制策略的泛化规律,为跨维度仿真提供了实证依据。同时,数据集支持的可微分模型预测控制验证,催生了结合梯度优化与强化学习的新型混合控制框架探索,加速了端到端可微分流体控制方法的发展进程。
数据集最近研究
最新研究方向
在流体力学与强化学习交叉领域,FluidGym作为首个独立、全可微的主动流控制基准套件,正引领该领域的前沿研究方向。其核心突破在于消除了对外部计算流体动力学软件的依赖,通过集成GPU加速的PICT求解器与PyTorch框架,实现了从仿真到控制的端到端可微性,为梯度基控制方法提供了统一平台。当前研究热点聚焦于利用其全可微分特性探索可微预测控制与可微强化学习的融合,以加速训练并提升控制策略的样本效率。同时,该数据集支持从二维到三维、从单智能体到多智能体的策略迁移研究,为复杂湍流环境下的分布式协同控制提供了标准化评估基础。这一进展不仅推动了流控算法在减阻、热传导增强等工程场景中的实际应用,也为高维非线性系统的智能控制奠定了可扩展的理论与实验基础。
相关研究论文
- 1Plug-and-Play Benchmarking of Reinforcement Learning Algorithms for Large-Scale Flow Control多特蒙德工业大学; 拉马尔机器学习与人工智能研究所; 慕尼黑工业大学 · 2026年
以上内容由遇见数据集搜集并总结生成



