PDEInvBenchCode

Hugging Face2026-01-17 更新2026-01-18 收录

下载链接：

https://huggingface.co/datasets/DabbyOWL/PDEInvBenchCode

下载链接

链接失效反馈

官方服务：

资源简介：

PDEInvBench是一个用于在偏微分方程（PDE）逆问题中基准测试神经操作器的存储库。它支持多种PDE系统、训练策略和神经网络架构。数据集用于从观察到的时空解场中恢复系统的未知物理参数（如粘度、扩散率或反应系数）。逆问题在科学计算和工程中是一个具有挑战性但基础的任务，出现在地球物理勘探、流体力学、生物医学成像和材料设计等多种应用中。

PDEInvBench is a repository for benchmarking neural operators in inverse problems of partial differential equations (PDEs). It supports multiple PDE systems, training strategies and neural network architectures. The dataset is designed to recover unknown physical parameters (such as viscosity, diffusivity or reaction coefficients) of the system from observed spatio-temporal solution fields. Inverse problems are a challenging yet fundamental task in scientific computing and engineering, with applications spanning geophysical exploration, fluid mechanics, biomedical imaging, materials design and other domains.

创建时间：

2026-01-15

原始信息汇总

PDEInvBench数据集概述

数据集基本信息

数据集名称: PDEInvBench (PDE Inverse Problem Benchmarking)
数据集地址: https://huggingface.co/datasets/DabbyOWL/PDE_Inverse_Problem_Benchmarking/tree/main
核心用途: 为偏微分方程（PDE）逆问题中的神经算子提供基准测试。

数据集内容与范围

支持的偏微分方程系统

1D Korteweg–De Vries (KdV) 方程
2D 反应扩散方程
2D 无外力纳维-斯托克斯方程
2D 受迫纳维-斯托克斯方程
2D 达西流

涵盖的逆问题方法

完全数据驱动方法
PDE残差损失方法
测试时定制化方法

涉及的模型架构

FNO (傅里叶神经算子): 基于谱偏置的架构
scOT (可扩展算子变换器): 基于注意力机制的架构
ResNet: 基于卷积局部偏置的架构

数据获取与使用

下载方式

通过提供的Python脚本进行批量下载： bash python3 huggingface_pdeinv_download.py --dataset darcy-flow-241 --split train --local-dir ./data

可用数据集示例

darcy-flow-241
korteweg-de-vries-1d
navier-stokes-forced-2d
reaction-diffusion-2d-du

数据配置选项

时间窗口采样: 控制every_nth_window参数
数据使用比例: 通过frac_ics_per_param和frac_param_combinations控制
时空划分: 通过train_window_end_percent和test_window_start_percent控制训练/测试时间分割
空间分辨率: 支持从512×512下采样到64×64的多分辨率处理

实验设计维度

训练与优化策略

完全数据驱动监督: 使用配对的参数-解数据进行标准监督训练
物理信息训练: 包含PDE残差损失项进行自监督正则化
测试时定制化: 在推理时使用PDE残差进行后训练微调，以适应新的参数体系

问题表示与归纳偏置

导数条件: 将空间/时间导数作为输入
时间条件: 仅使用原始解快照
时间帧数: 支持2、5、10、15、20、25帧的条件设置

扩展实验

模型容量扩展: 支持50万、500万、5000万参数规模的模型
数据量扩展:
- 初始条件多样性扩展（控制frac_ics_per_param）
- 参数空间覆盖扩展（控制frac_param_combinations）
- 时间范围扩展（控制train_window_end_percent）
空间分辨率扩展: 支持64×64、128×128、256×256、512×512分辨率

技术特性

环境要求

Python版本: 3.11
深度学习框架: PyTorch 2.7, PyTorch Lightning 2.5
神经算子库: neuraloperator 0.3.0
科学计算库: scipy, numpy, h5py, torch-harmonics
配置管理: Hydra 1.3, OmegaConf 2.3

代码结构

配置管理: configs/目录包含所有实验配置
数据处理: scripts/目录包含数据预处理工具
模型实现: pdeinvbench/models/目录包含所有神经网络实现
训练脚本: train_inverse.py为主训练脚本

验证与测试

测试框架: 包含PDE残差计算和数值实现的验证脚本
形状检查: 使用jaxtyping进行运行时张量形状验证
可视化: 生成PDE残差时空演化的动画GIF

实验运行

基本命令

bash python3 train_inverse.py --config-name={pde_system}

支持的PDE系统：1dkdv, 2dtf, 2dns, 2drdk, 2drddu, 2ddf

分布式训练

支持单GPU、多GPU和多节点SLURM集群训练配置。

搜集汇总

数据集介绍

构建方式

在偏微分方程反问题研究领域，数据集的构建是评估神经网络算子性能的基石。PDEInvBench数据集通过数值求解多种经典偏微分方程系统生成，涵盖了Korteweg–De Vries方程、反应扩散方程、Navier-Stokes方程以及达西流等关键物理模型。每个系统的数据均基于严格定义的参数空间和初始条件，采用高保真数值模拟器生成时空解场，并对应标注了待反演的物理参数。数据生成过程注重多样性，通过系统性地采样参数组合与初始状态，构建了具有不同复杂度、分辨率和时间跨度的配对数据集，为反问题研究提供了坚实且可复现的基准。

特点

该数据集的核心特征在于其针对偏微分方程反问题设计的系统性与全面性。它集成了多个具有不同数学特性和应用背景的PDE系统，每个系统都提供了从低到高多种空间分辨率的数据，并包含了丰富的参数组合与初始条件。数据集特别强调了问题的病态性和对噪声的敏感性，为评估模型在数据驱动、物理信息约束以及测试时自适应等多种学习范式下的性能提供了标准化的测试平台。其结构化设计支持对模型容量、数据量、时间窗口和空间分辨率等因素进行可控的缩放实验，从而能够深入探究神经网络算子在反问题中的可扩展性与泛化能力。

使用方法

使用该数据集需依托其配套的代码库与配置管理系统。研究人员可通过提供的脚本从指定平台下载所需PDE系统的数据。实验运行基于Hydra配置框架，允许用户通过命令行灵活覆盖模型架构、训练策略、数据采样比例及分辨率等超参数。典型工作流程包括：选择目标PDE系统的基础配置文件，指定使用FNO、ResNet或scOT等神经网络算子模型，并配置完全数据驱动、物理残差损失或测试时微调等训练策略。代码库支持多GPU分布式训练，并集成了完整的测试与验证流程，便于对模型预测的物理参数准确性及其满足PDE约束的程度进行定量评估与可视化分析。

背景与挑战

背景概述

偏微分方程反问题作为科学计算与工程领域的核心挑战，旨在从观测的时空解场中重建系统的未知物理参数，如粘性、扩散系数或反应速率。PDEInvBench数据集由DabbyOWL等研究团队构建，作为一个综合性基准平台，专注于评估神经算子在多种PDE系统反问题中的性能。该数据集涵盖了Korteweg–De Vries方程、反应扩散系统、Navier-Stokes方程以及达西流等经典模型，通过提供标准化的数据与评估框架，推动了物理信息机器学习与计算数学的交叉融合，为参数识别、模型泛化及不确定性量化等研究提供了关键基础设施。

当前挑战

在偏微分方程反问题领域，核心挑战在于问题的病态性与对噪声的高度敏感性，这导致从有限且含噪的观测数据中稳定重建参数变得极为困难。数据集的构建过程同样面临多重挑战：需在多种PDE系统间保持数据格式与参数范围的一致性；生成高保真数值解要求精细的网格离散与稳定的时间积分，计算成本高昂；此外，为涵盖多样的初始条件与参数组合以确保模型的泛化能力，必须精心设计采样策略，平衡数据规模与计算可行性。

常用场景

经典使用场景

在偏微分方程反问题研究领域，PDEInvBench数据集为评估神经算子在参数识别任务中的性能提供了标准化基准。该数据集涵盖了Korteweg–De Vries方程、反应扩散系统、Navier-Stokes方程以及达西流等多种经典PDE系统，支持从时空解场中恢复未知物理参数的核心任务。研究者通常利用该数据集，在完全数据驱动、物理信息损失以及测试时微调等多种训练策略下，系统比较Fourier神经算子、可扩展算子变换器及残差网络等模型的泛化能力与鲁棒性，从而深入探索不同架构在处理病态反问题时的优势与局限。

衍生相关工作

围绕PDEInvBench数据集，已衍生出一系列具有影响力的研究工作。例如，基于Fourier神经算子的扩展架构被用于探索谱方法在反问题中的泛化特性；可扩展算子变换器（scOT）的引入推动了注意力机制在高维PDE参数空间建模中的应用。同时，测试时微调策略的提出，显著提升了模型在分布外参数场景下的适应能力。这些工作不仅深化了对神经算子归纳偏置的理解，也催生了如物理信息正则化与元学习相结合的新型训练范式，为后续在更复杂多物理场反问题中的应用奠定了方法论基础。

数据集最近研究