PDEBench

arXiv2023-03-13 更新2024-07-30 收录

下载链接：

https://github.com/pdebench/PDEBench

下载链接

链接失效反馈

官方服务：

资源简介：

PDEBench是一个基于偏微分方程(PDEs)的时间依赖模拟任务的基准套件，包含代码和数据，用于基准测试新型机器学习模型与经典数值模拟和机器学习基线的性能。该数据集具有更广泛的PDE范围，更大的即用型数据集，以及更易于扩展的源代码和用户友好的API。

PDEBench is a benchmark suite for time-dependent simulation tasks based on partial differential equations (PDEs). It includes code and datasets, designed to benchmark the performance of novel machine learning models against classical numerical simulations and machine learning baselines. This benchmark suite features a wider range of PDEs, larger ready-to-use datasets, more extensible source code and a user-friendly API.

创建时间：

2022-10-14

原始信息汇总

PDEBench 数据集概述

数据集描述

PDEBench 提供了一个多样化和全面的科学机器学习基准，包括具有挑战性和现实性的物理问题。该数据集涵盖了比现有基准更广泛的偏微分方程（PDEs），并包括现实和困难的问题（正向和逆向），更大的即用型数据集，包含各种初始和边界条件以及 PDE 参数。

数据集内容

数据集链接: PDEBench Datasets
预训练模型链接: PDEBench Pre-Trained Models

数据生成

数据生成代码包含在 data_gen 目录中，包括以下脚本：

gen_diff_react.py: 生成 2D 扩散-反应数据。
gen_diff_sorp.py: 生成 1D 扩散-吸附数据。
gen_radial_dam_break.py: 生成 2D 浅水数据。
gen_ns_incomp.py: 生成 2D 不可压缩非均质 Navier-Stokes 数据。
plot.py: 绘制生成的数据。
uploader.py: 将生成的数据上传到数据仓库。

数据下载

提供了两种下载数据的方法：

使用 download_direct.py（推荐）
使用 download_easydataverse.py（不推荐）

基准模型

提供了三种不同的机器学习模型进行训练和评估：

FNO: 傅里叶神经算子
U-Net: 卷积神经网络
PINN: 物理信息神经网络

配置文件

配置文件用于设置数据位置和其他参数，示例文件位于 example.env。

目录结构

PDEBench 的目录结构如下：

📂 pdebench |_📁 models |_📁 data_download |_📁 data_gen |_📄 init.py

引用

如果使用 PDEBench 数据集和/或源代码，请引用以下论文：

搜集汇总

数据集介绍

构建方式

PDEBench数据集通过模拟基于偏微分方程（PDE）的时间依赖性任务构建，涵盖了从相对常见的例子到更具挑战性和现实性的问题。数据集包括多种PDE的代码和数据，涵盖了广泛的初始条件和边界条件，以及PDE参数。数据集的生成代码具有用户友好的API，支持数据生成和基线结果的计算，基线模型包括FNO、U-Net、PINN和基于梯度的逆向方法。

特点

PDEBench数据集的特点在于其广泛的PDE覆盖范围、大规模的可用数据集以及可扩展的源代码。数据集不仅包括常见的PDE问题，还涵盖了更具挑战性的现实问题，提供了多种初始条件和边界条件的模拟结果。此外，数据集支持用户通过标准化的API自由扩展基准，并提供了新的评估指标，旨在更全面地理解科学机器学习方法的性能。

使用方法

PDEBench数据集的使用方法包括通过提供的API生成数据或下载高保真度的模拟数据集。用户可以通过PyTorch等框架加载数据，并使用数据加载器进行模型训练和评估。数据集还提供了预训练的基线模型，用户可以将其与新模型进行性能比较。此外，数据集的代码和数据格式均遵循FAIR数据原则，确保了数据的易用性和可扩展性。

背景与挑战

背景概述

PDEBench数据集由NEC Labs Europe、University of Stuttgart等机构的研究人员于2022年创建，旨在为科学机器学习（Scientific Machine Learning, SciML）领域提供一个全面且具有挑战性的基准。该数据集基于偏微分方程（PDEs），涵盖了从简单到复杂的多种时间依赖性模拟任务。PDEBench不仅提供了代码和数据，还允许研究人员通过标准化的API扩展基准，并与现有的经典数值模拟和机器学习基线方法进行性能比较。该数据集的独特之处在于其广泛的PDE覆盖范围、大规模的可用数据集以及用户友好的API，使其成为科学机器学习领域的重要资源。

当前挑战

PDEBench数据集面临的挑战主要集中在两个方面：一是解决科学机器学习领域中缺乏全面且具有挑战性基准的问题；二是构建过程中遇到的计算和数据生成难题。首先，现有的科学机器学习基准通常覆盖范围有限，难以代表广泛的物理系统问题。PDEBench通过提供多种PDE和参数组合，填补了这一空白。其次，生成大规模、高质量的PDE数据集需要大量的计算资源和时间，尤其是在处理复杂的三维问题时。此外，PDEBench还引入了新的评估指标，以更好地理解机器学习方法在科学机器学习中的表现，并识别出对现有方法具有挑战性的任务。

常用场景

经典使用场景

PDEBench 数据集的经典使用场景主要集中在科学机器学习领域，特别是用于评估和比较不同机器学习模型在求解偏微分方程（PDE）时的性能。该数据集包含了多种不同类型的 PDE 问题，涵盖了从简单的 1D 方程到复杂的 3D 系统，适用于测试模型的泛化能力和对不同物理条件的适应性。

衍生相关工作

PDEBench 数据集的发布催生了一系列相关工作，特别是在科学机器学习领域。许多研究者基于该数据集开发了新的模型和算法，如改进的神经算子（FNO）、物理信息神经网络（PINN）等。此外，该数据集还促进了不同模型之间的比较研究，推动了科学机器学习方法的标准化和优化。

数据集最近研究