five

PDEBench_2D_DarcyFlow

收藏
Hugging Face2025-11-13 更新2025-11-14 收录
下载链接:
https://huggingface.co/datasets/Nionio/PDEBench_2D_DarcyFlow
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了用于2D Darcy流动的PDEBenchmark数据,特征包括每个单元的扩散系数和流速,以及全局的强迫量大小。数据集包含50000个样本,适用于流体力学相关的研究和学习。

This dataset contains PDEBenchmark data for 2D Darcy flow. Its features include the diffusion coefficient and flow velocity of each computational cell, as well as the magnitude of the global forcing term. The dataset comprises 50,000 samples and is applicable to research and learning related to fluid mechanics.
创建时间:
2025-11-12
原始信息汇总

PDEBench_2D_DarcyFlow 数据集概述

基本信息

  • 许可证: CC-BY-4.0
  • 数据集大小: 6,554,400,000 字节
  • 下载大小: 3,321,884,222 字节
  • 样本数量: 50,000

数据特征

特征字段

  • Base_2_2/Zone/CellData/diffusion_coefficient: 扩散系数,数据类型为float32列表
  • Base_2_2/Zone/CellData/flow: 流动场,数据类型为float32列表
  • Global/forcing_magnitude: 强迫项幅值,数据类型为float32列表

数据分割

  • 分割名称: all_samples
  • 样本数量: 50,000
  • 数据大小: 6,554,400,000 字节

数据格式说明

  • 所有特征字段以展平的128×128图像格式存储
  • 使用前需要通过reshape操作恢复为(128, 128)的二维格式
  • 支持转换为PyTorch张量格式

使用方式

数据集可通过Plaid库的huggingface_bridge加载,支持DataLoader批量处理,建议批量大小为32。

搜集汇总
数据集介绍
main_image_url
构建方式
在计算流体力学领域,PDEBench_2D_DarcyFlow数据集通过数值模拟方法系统构建。该数据集基于达西流动的偏微分方程控制理论,采用结构化网格离散化技术生成五万个独立样本。每个样本包含128×128分辨率的扩散系数与流动场数据,并同步记录全局强迫项参数,通过高精度数值解法确保物理场数据的数学一致性。
特点
该数据集的核心特征体现在多物理场耦合数据的完整封装,每个样本均包含扩散系数张量、速度场分布及强迫项参数三重属性。数据以浮点精度存储并保持张量结构,其128×128的网格分辨率既能捕捉复杂流动细节又兼顾计算效率。五万样本规模为机器学习模型提供了充分的训练空间,统一的网格格式则简化了数据预处理流程。
使用方法
使用该数据集时需通过专用桥接工具加载HuggingFace存储库,利用特征重命名功能将原始字段映射为语义化变量。转换为PyTorch张量格式后,需执行维度重构操作将扁平数据恢复为二维场分布。最终通过数据加载器实现批处理与随机采样,支持直接输入至卷积神经网络等架构进行端到端训练。
背景与挑战
背景概述
在计算流体力学领域,达西流模型作为描述多孔介质中流体运动的核心方程,长期支撑着地下水文和石油工程等关键应用。PDEBench_2D_DarcyFlow数据集由科研团队于2022年构建,旨在通过大规模数值模拟数据推动物理信息神经网络的发展。该数据集通过生成五万个二维达西流实例,为偏微分方程求解算法提供了标准化评估基准,显著加速了科学计算与人工智能的交叉融合进程。
当前挑战
达西流正反问题求解面临高维参数空间与非线性的双重挑战,传统数值方法在计算效率与精度间难以平衡。数据集构建过程中需克服多尺度物理场仿真的数值稳定性问题,同时确保扩散系数与流场数据的物理一致性。此外,128×128网格分辨率下的数据生成需协调计算资源与模型泛化需求,这对数值离散格式与边界条件处理提出了严格要求。
常用场景
经典使用场景
在计算流体力学领域,PDEBench_2D_DarcyFlow数据集为研究多孔介质中的达西流动现象提供了标准化基准。该数据集通过128×128网格的扩散系数与流速场数据,成为验证物理信息神经网络和算子学习方法的经典工具,尤其适用于评估模型在复杂边界条件下对偏微分方程解的逼近能力。
衍生相关工作
该数据集催生了系列突破性研究,如基于傅里叶神经算子的快速求解器、结合生成对抗网络的场重构方法等。这些工作不仅拓展了科学计算人工智能的应用边界,更形成了物理约束机器学习的新技术路线,持续推动着计算力学与深度学习的交叉融合。
数据集最近研究
最新研究方向
在计算流体力学领域,PDEBench_2D_DarcyFlow数据集正推动基于物理信息的神经网络研究迈向新高度。该数据集通过提供高分辨率达西流场数据,成为探索多孔介质中复杂流动现象的重要基石。当前研究聚焦于开发端到端的深度学习架构,旨在直接从扩散系数场精准预测流速分布,显著提升地下水资源模拟与油气勘探的数值计算效率。随着算子学习理论的深化,该数据集进一步催化了基于傅里叶神经算子的新型建模方法,为突破传统偏微分方程求解器的计算瓶颈提供关键实验支撑。这些进展不仅加速了环境工程领域的数字化进程,更为跨尺度流动预测建立了可扩展的基准框架。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作