camlab-ethz/Poisson-Gauss
收藏Hugging Face2024-05-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/camlab-ethz/Poisson-Gauss
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-nc-4.0
---
# Short Description
Based on the Poisson equation, this dataset contains the solution when given a source term that is a sum of Gaussians, see https://arxiv.org/abs/2405.19101.
# Dimensions
The NetCDF file has **two** variables called *solution* with dimensionality
- 20000 (number of samples)
- 128 (x-dim)
- 128 (y-dim)
and *source* with dimensionality:
- 20000 (number of samples)
- 128 (x-dim)
- 128 (y-dim)
# Train/Val/Test-split
19640/120/240 trajectories
# Download
The dataset can be downloaded, e.g., via `huggingface-cli download`.
许可证:CC BY-NC 4.0
# 简短描述
本数据集基于泊松方程(Poisson equation)构建,收录了当源项为高斯函数之和时的解,详见论文https://arxiv.org/abs/2405.19101。
# 维度信息
该NetCDF文件包含两个变量,分别为*解(solution)*与*源项(source)*,其维度信息如下:
- 解(solution):维度依次为20000(样本数量)、128(x轴维度)、128(y轴维度)
- 源项(source):维度依次为20000(样本数量)、128(x轴维度)、128(y轴维度)
# 训练/验证/测试集划分
训练集/验证集/测试集的轨迹数为19640/120/240。
# 下载方式
该数据集可通过例如`huggingface-cli download`命令进行下载。
提供机构:
camlab-ethz
原始信息汇总
数据集概述
数据集描述
本数据集基于泊松方程,包含在给定源项为高斯函数之和时的解。源项的详细描述可参考论文arXiv:2405.19101。
数据集维度
数据集包含两个变量:
- solution:
- 样本数: 20000
- x维度: 128
- y维度: 128
- source:
- 样本数: 20000
- x维度: 128
- y维度: 128
数据集分割
数据集分为训练集、验证集和测试集,具体分割如下:
- 训练集: 19640条轨迹
- 验证集: 120条轨迹
- 测试集: 240条轨迹
数据集下载
数据集可通过命令huggingface-cli download进行下载。
搜集汇总
数据集介绍

构建方式
在计算流体力学与偏微分方程数值解领域,Poisson-Gauss数据集通过求解泊松方程构建而成。该数据集的核心在于源项被设定为多个高斯函数的线性组合,这一设计模拟了物理场中常见的局部化源分布。具体构建过程涉及在128×128的二维均匀网格上,对每个样本独立生成高斯源项,随后利用数值方法求解对应的泊松方程,从而得到精确的势场解。最终数据集囊括了两万个独立的样本对,确保了问题的多样性与数值稳定性。
使用方法
使用该数据集时,研究人员可通过Hugging Face平台提供的`huggingface-cli`工具直接下载,便捷地获取完整的NetCDF文件。在加载数据后,用户可分别访问`source`与`solution`变量,它们分别对应泊松方程的输入源项与数值解。该数据集适用于训练深度学习模型,特别是用于学习从源项到势场的映射关系,在物理信息神经网络、算子学习及生成模型等研究方向具有直接的应用价值。数据已预先分割为训练、验证与测试集,用户可直接按此划分进行模型训练与性能评估,确保了实验的可复现性。
背景与挑战
背景概述
在计算物理与偏微分方程数值求解领域,高维参数化问题的高效模拟一直是核心研究议题。由camlab-ethz团队于2024年构建的Poisson-Gauss数据集,正是针对泊松方程在复杂高斯源项激励下的数值解进行系统化采集的成果。该数据集以NetCDF格式存储了20000个样本,每个样本包含128x128网格上的源项与对应解,旨在为基于物理信息的神经网络、算子学习及不确定性量化等前沿方向提供基准数据。其设计紧密关联着如何通过数据驱动方法替代传统数值模拟,以降低计算成本并提升泛化能力,对计算数学与科学机器学习交叉领域的发展具有显著的推动作用。
当前挑战
该数据集致力于应对泊松方程在高维参数空间中的快速求解与泛化挑战,特别是当源项为多个高斯函数叠加时,传统数值方法面临计算复杂度高、适应性弱的局限。在构建过程中,研究者需克服大规模数值模拟的数据生成效率问题,确保解在边界条件与物理约束下的一致性;同时,数据集的网格分辨率与样本规模需在计算资源与模型训练需求间取得平衡,以保障其既能捕捉解的细微特征,又适用于主流深度学习框架的高效处理。
常用场景
经典使用场景
在计算物理学与偏微分方程数值解领域,Poisson-Gauss数据集为研究泊松方程的求解提供了关键基准。该数据集通过高斯函数叠加构造源项,生成对应的数值解,经典使用场景包括训练和评估基于深度学习的物理信息神经网络模型。研究者利用其高分辨率二维网格数据,验证模型在复杂边界条件和源项下的泛化能力,推动计算效率与精度的双重提升。
解决学术问题
该数据集有效解决了传统数值方法在高维泊松方程求解中计算成本高昂的学术难题。通过提供大规模标准化的源项-解配对数据,它支持机器学习模型学习泊松算子的隐式映射,从而替代迭代求解器。这促进了物理驱动机器学习在偏微分方程领域的理论发展,为复杂物理系统的快速仿真提供了新范式。
实际应用
在实际工程与科学计算中,Poisson-Gauss数据集的应用涵盖电磁场模拟、流体力学及图像处理等多个领域。例如,在半导体器件设计中,可借助该数据集训练的模型快速预测电势分布;在地球物理反演中,它能加速重力或磁场的正演计算。这些应用显著降低了大规模数值模拟的资源消耗。
数据集最近研究
最新研究方向
在偏微分方程数值解领域,Poisson-Gauss数据集为研究高斯源项泊松问题的深度学习方法提供了关键基准。该数据集通过模拟高斯函数组合的源项及其对应解,推动了基于物理信息的神经网络在复杂边界条件与多尺度问题中的前沿探索。当前研究热点集中于利用该数据集训练生成模型,以高效预测高维空间中的场分布,显著提升了计算流体力学与电磁仿真中的正向与逆向问题求解效率。这一进展不仅加速了科学计算工具的智能化转型,也为跨学科工程优化开辟了新路径。
以上内容由遇见数据集搜集并总结生成



