camlab-ethz/Wave-Layer
收藏Hugging Face2024-07-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/camlab-ethz/Wave-Layer
下载链接
链接失效反馈官方服务:
资源简介:
该数据集基于波动方程,包含从初始条件开始的轨迹,这些初始条件是高斯函数的和,并通过空间变化的波速传播,波速在垂直分层介质中变化。数据集包含两个变量:solution和c,分别具有不同的维度。数据集被划分为训练集、验证集和测试集,分别为10212、60和240个轨迹。数据集可以通过`huggingface-cli download`下载,并使用提供的`assemble_data.py`脚本将分块数据组装成单个NetCDF文件。
该数据集基于波动方程,包含从初始条件开始的轨迹,这些初始条件是高斯函数的和,并通过空间变化的波速传播,波速在垂直分层介质中变化。数据集包含两个变量:solution和c,分别具有不同的维度。数据集被划分为训练集、验证集和测试集,分别为10212、60和240个轨迹。数据集可以通过`huggingface-cli download`下载,并使用提供的`assemble_data.py`脚本将分块数据组装成单个NetCDF文件。
提供机构:
camlab-ethz
原始信息汇总
数据集概述
简短描述
该数据集基于波动方程,包含从初始条件开始的轨迹,这些初始条件是高斯函数的和,并通过空间变化的波速在垂直分层介质中传播。详情参见 arXiv:2405.19101。
维度
组装后的 NetCDF 文件包含 两个 变量。第一个变量名为 solution,其维度为:
- 10512(轨迹数量)
- 15(时间步长)
- 128(x 维度)
- 128(y 维度)
第二个变量名为 c,其维度为:
- 10512(轨迹数量)
- 128(x 维度)
- 128(y 维度)
该数据集在单位正方形上模拟至 T=1,并以均匀的空间和时间间隔保存。
训练/验证/测试分割
数据集分为 10212/60/240 条轨迹。
下载与组装
数据集可以通过 huggingface-cli download 等方式下载。
下载后,可以使用提供的 assemble_data.py 脚本将分块数据组装成单个 NetCDF 文件。使用方法如下:
bash
python assemble_data.py --input_dir . --output_file Wave-Layer.nc
搜集汇总
数据集介绍

构建方式
在波动方程的理论框架下,该数据集通过数值模拟方法构建而成。其初始条件设定为多个高斯函数的叠加,随后在垂直分层介质中随空间变化的波速下进行传播,模拟过程基于严格的物理方程。数据生成于单位正方形区域内,时间跨度至T=1,并在空间与时间维度上均匀采样,最终形成包含10512条轨迹的高维数据集,每条轨迹涵盖15个时间步长及128x128的空间网格。
特点
该数据集以NetCDF格式存储,包含两个核心变量:'solution'记录波动传播的轨迹,维度为10512×15×128×128;'c'则表征垂直分层介质的波速场,维度为10512×128×128。数据集已预先划分为训练集(10212条轨迹)、验证集(60条轨迹)与测试集(240条轨迹),结构清晰且便于机器学习模型的训练与评估。其基于波动方程的物理一致性,为研究波在复杂介质中的传播提供了高保真的仿真数据。
使用方法
用户可通过HuggingFace平台提供的工具下载数据集,例如使用`huggingface-cli download`命令。下载后,需运行附带的`assemble_data.py`脚本,将分块数据整合为单一的NetCDF文件,具体命令为`python assemble_data.py --input_dir . --output_file Wave-Layer.nc`。整合后的文件可直接用于数值分析或机器学习任务,支持对波动传播轨迹与介质参数的联合建模,适用于物理信息神经网络等前沿研究领域。
背景与挑战
背景概述
在计算物理学与科学机器学习领域,波动方程作为描述声波、电磁波等传播现象的核心偏微分方程,其数值模拟与反演问题一直是研究热点。由camlab-ethz团队创建的Wave-Layer数据集,基于波动方程构建,旨在提供大量在垂直分层介质中传播的波场轨迹数据。该数据集通过将初始条件设定为高斯和的形式,并在空间变化的波速场中传播,为波动反演、介质参数估计及深度学习驱动的地球物理建模等研究提供了关键基准。其生成依托于严格的数值模拟,体现了计算科学与数据驱动方法在复杂介质波传播问题中的融合趋势。
当前挑战
Wave-Layer数据集所针对的核心挑战在于波动反演问题,即从观测波场中推断地下介质的空间变化参数,这一任务因方程的非线性、解的高维性及观测数据的有限性而极具难度。构建过程中的挑战则集中于高效生成大规模、高保真的合成数据:需在二维单位正方形域上精确模拟波动传播,同时管理高达数万条轨迹、每轨迹包含多时间步与空间网格点的庞大数据量,并确保数据在时空上的均匀采样与存储格式的标准化,以支持后续机器学习模型的训练与验证。
常用场景
经典使用场景
在计算物理学与地球物理学领域,Wave-Layer数据集为波动方程建模提供了关键支持。该数据集通过模拟垂直分层介质中高斯和初始条件下的波传播轨迹,成为研究波动力学与介质异质性相互作用的经典工具。其高维时空数据(包含10512条轨迹,每轨迹15个时间步,128x128空间网格)使得研究者能够深入分析波前演化、反射与折射现象,为波动方程的数值解验证与参数反演奠定了坚实基础。
解决学术问题
Wave-Layer数据集有效解决了波动传播研究中长期存在的若干挑战。它通过提供大规模、高分辨率的模拟数据,帮助学术界克服了传统实验数据稀缺与计算成本高昂的局限。该数据集支持波速场重建、介质层析成像等逆问题的研究,并为深度学习模型在物理信息神经网络(PINNs)中的训练提供了标准化基准。其意义在于推动了计算波动力学与机器学习交叉领域的发展,促进了波动方程数值方法的高效验证与优化。
衍生相关工作
基于Wave-Layer数据集,学术界衍生出多项经典研究工作。这些工作主要集中在物理引导的机器学习框架开发,如利用卷积神经网络进行波速场快速反演,以及生成对抗网络用于波动数据增强。相关研究还拓展至时空预测模型的构建,例如基于Transformer的波传播序列建模,这些成果显著提升了波动模拟的效率与泛化能力,并推动了arXiv:2405.19101等前沿文献中所述方法的实际应用与理论深化。
以上内容由遇见数据集搜集并总结生成



